摘要
本发明涉及语音处理技术领域,可应用于金融科技、医疗健康等业务场景中,公开了一种语音意图识别方法、装置、设备及介质,包括:获取待处理的语音信号,对语音信号进行语音活动检测处理,划分为多个语音片段,分析多个语音片段的语义内容,确定每个语音片段的语义相关性信息,分析多个语音片段的声源属性,确定每个语音片段的声场类型信息,根据语义相关性信息和声场类型信息从多个语音片段中筛选出目标语音片段,基于目标语音片段执行意图识别处理,生成意图识别结果。本发明通过语义相关性信息与声场类型信息的双重分析机制,在语音识别前实现对语音片段的有效筛选,有效避免非目标语音或干扰片段被送入意图识别模型,提升了识别结果的准确性。
技术关键词
语音意图识别方法
语音活动检测
语义意图
编码向量
信号
梅尔频率倒谱系数
麦克风阵列采集
声学特征
频谱特征
语义向量
多通道噪声
意图识别模型
语音采集模块
语音识别模型
声场特征
系统为您推荐了相关专利信息
水温检测方法
EEMD算法
Adaboost模型
集成经验模态分解
LSTM模型
电子后视镜系统
图像
时间差
故障报警信息
故障容错
诊断方法
电磁仿真
非均匀等离子体
极值
校准算法
数据采集方法
节点
特征提取算法
识别算法
异常数据点