摘要
本发明涉及语音识别技术领域,尤其涉及一种基于双模质心的自定义唤醒词识别方法、装置和设备。方法基于双模质心机制,通过获取待识别向量,与动态漂移质心进行相似度计算,得到唤醒相似度,并判断其是否大于预设阈值,确定该待识别向量是否可以用于更新动态漂移质心。动态漂移质心初始为静态锚点质心,支持基于有效唤醒语音的自适应更新,并引入回调机制防止动态漂移质心过度偏离。技术方案融合静态锚点的安全性与动态漂移质心的适应性,实现身份感知的个性化识别。本发明有效提升唤醒识别的准确率与鲁棒性,降低误唤醒率,增强系统对用户发音变化和环境噪声的适应能力,提升用户体验,适用于智能音箱、可穿戴设备等需语音触发的场景。
技术关键词
自定义唤醒词
识别方法
动态
编码器
注意力
锚点
音频
语音识别技术
回调机制
可穿戴设备
智能音箱
识别装置
计算机设备
网络
存储器
鲁棒性
处理器
样本
系统为您推荐了相关专利信息
激光器温度控制系统
动态卡尔曼滤波
半导体制冷片
温度采集模块
PID算法
答案
大语言模型
生成方法
计算机程序产品
可读存储介质