摘要
本发明公开了一种语音交互毛绒玩具的智能唤醒方法、设备及介质,涉及语音交互技术领域,包括,基于原始语音信号构建二维统计图,利用峰值检测和欧式距离分类生成候选声源掩膜集合,对候选声源掩膜集合按照密度得分、谐波性得分和韵律特征得分进行综合排名,获取主声源掩膜,基于幅度衰减比与时延对主声源掩膜进行细化加权,生成主声源软掩膜,并获取纯净语音信号,对纯净语音信号提取梅尔倒谱系数特征,结合隐马尔可夫模型进行音素解码,检测唤醒词及语义触发词,进而判定毛绒玩具的唤醒状态。本发明通过基于音素级隐马尔可夫模型的轻量化建模,实现对唤醒词及语义触发词的精准解码,避免了大规模神经网络的高算力依赖。
技术关键词
智能唤醒方法
毛绒玩具
韵律特征
掩膜
隐马尔可夫模型
重构语音信号
短时傅里叶变换
语义
包络
序列
双麦克风阵列
谐波
语音信号提取
语音交互技术
梅尔倒谱系数
滤波器
时延
系统为您推荐了相关专利信息
信息提取方法
图像分析
关节点
人体姿态估计
关键点
定量注油
动态补偿模块
抽油机
隐马尔可夫模型
卡尔曼滤波算法
点扩散函数
光电成像系统
隐私保护功能
随机梯度下降
分布特征
图像修复方法
图像修复模型
输出特征
联合损失函数
融合特征