摘要
本发明实施例提供一种对话系统的数据挖掘方法及系统,所述方法包括:识别音频数据,得到原始query,并对原始query进行预处理;判断线上NLP系统是否能够识别预处理后的原始query,当线上NLP系统不能识别时,对原始query进行向量相似度聚类,匹配查询簇;将查询簇与线上NLP系统的分类结果进行对比,确定差异项;通过预训练语言模型对所差异项进行分类,并检查分类置信度是否达到预设阈值,当分类置信度达到预设阈值时,将差异项标记为更新项。
技术关键词
数据挖掘方法
对话系统
预训练语言模型
学习识别系统
可执行程序代码
数据挖掘系统
预训练模型
验证系统
聚类算法
意图
音频
存储器
处理器
标记
度量
识别模块
可读存储介质
电子设备
系统为您推荐了相关专利信息
队列
硬件执行资源
仲裁方法
可执行程序代码
处理器
沉浸式交互
贝叶斯个性化排序
生成对抗网络
性能优化框架
渲染算法
检索方法
索引
特征提取器
特征提取模块
注意力机制
推荐模型训练方法
深度学习模型
预训练语言模型
网络特征
统计特征