摘要
本发明涉及自然语言处理领域,公开了一种话术分类模型的优化方法、装置、计算机设备及存储介质,包括:获取由多条话术文本构成的初始样本集,响应于对每条话术文本的人工打标确定每条话术文本的基准分类结果;利用话术分类模型对初始样本集进行分类,得到每条话术文本的模型分类结果;根据模型分类结果以及基准分类结果,筛选分类结果错误的质检文本;对质检文本进行数据增强,形成新增样本集;利用初始样本集以及新增样本集,对话术分类模型进行训练,得到优化后的话术分类模型。针对话术分类模型输出的错误分类结果所对应的样本进行定点数据增强,结合数据增强后的新样本对话术分类模型进行优化,提高了话术分类模型的准确性。
技术关键词
文本
样本
基准
计算机设备
前馈神经网络
编码器
可读存储介质
分类器
数据
处理器
优化装置
注意力机制
自然语言
控件
存储器
训练集
系统为您推荐了相关专利信息
无线电调制信号
预测编码器
调制识别方法
序列
信号调制识别技术
超文本传输请求
传输编码技术
公网
传输编码指示信息
算法引擎