摘要
本申请涉及语音交互识别技术领域,具体涉及一种智能互动玩具的语音交互识别方法,该方法包括:基于各年龄段儿童语音信号的频谱特征确定各年龄段的自适应梅尔滤波器组及各帧语音信号的自适应滤波器权重,基于此计算儿童语音信号的MFCC特征向量,与传统的成人语音信号的MFCC特征向量进行比较,基于成人语音与各年龄段儿童语音之间的所述特征向量的差异,构建各年龄段的总损失函数,对所述通用声学模型进行训练,得到各年龄段的微调后的模型;基于各年龄段的微调后的模型,结合教师‑学生模型,进行玩具的语音交互识别;消除年龄段差异的影响,提升了儿童语音识别准确性,通过教师‑学生模型完成个性化适配的同时保证识别的准确性。
技术关键词
语音交互识别方法
智能互动玩具
滤波器
教师
学生
信号
功率谱特征
儿童
玩具设备
成人
语音识别准确性
样本
置信度阈值
频谱特征
队列
数据
表达式