摘要
本发明公开了一种语音交互毛绒玩具的智能唤醒方法、设备及介质,涉及语音交互技术领域,包括,基于原始语音信号构建二维统计图,利用峰值检测和欧式距离分类生成候选声源掩膜集合,对候选声源掩膜集合按照密度得分、谐波性得分和韵律特征得分进行综合排名,获取主声源掩膜,基于幅度衰减比与时延对主声源掩膜进行细化加权,生成主声源软掩膜,并获取纯净语音信号,对纯净语音信号提取梅尔倒谱系数特征,结合隐马尔可夫模型进行音素解码,检测唤醒词及语义触发词,进而判定毛绒玩具的唤醒状态。本发明通过基于音素级隐马尔可夫模型的轻量化建模,实现对唤醒词及语义触发词的精准解码,避免了大规模神经网络的高算力依赖。
技术关键词
智能唤醒方法
毛绒玩具
韵律特征
掩膜
隐马尔可夫模型
重构语音信号
短时傅里叶变换
语义
包络
序列
双麦克风阵列
谐波
语音信号提取
语音交互技术
梅尔倒谱系数
滤波器
时延