摘要
本申请属于智能交互技术领域,公开了一种基于语音识别的对话交互方法及装置,该方法包括:获取音频数据,并对音频数据进行预处理,得到短时信号;提取短时信号中的音频特征信息;将音频特征信息输入全协方差的高斯混合模型,得到真人可能性评分;若真人可能性评分大于预设阈值,则将音频数据转换为文本数据对文本数据进行意图识别、实体识别和情感识别,得到识别结果;根据识别结果在对应的行业数据库中匹配对答文本;将对答文本转换为语音数据,并播放语音数据。本申请能够捕捉到短时信号的多样性和复杂性,提高音频识别的鲁棒性和准确性,避免对话引擎与非人对话,节省计算资源。
技术关键词
对话交互方法
音频特征信息
文本
语音
数据
高斯混合模型
意图识别
重构误差
智能交互技术
语句
信号
特征提取模块
声学特征
处理器
交互装置
曲线
拼音
播放模块
实体
系统为您推荐了相关专利信息
分类识别模型
分类识别方法
嵌套
高维特征向量
样本
工艺控制方法
复合材料成型设备
数学模型
复合材料制品
压力控制系统
策略网络模型
资源分配策略
启发式算法
规划
决策
文本纠错方法
纠错策略
标签
纠正策略
非暂态计算机可读存储介质
二维灰度图像
故障诊断模型
故障类别
编码器
特征提取网络