摘要
本发明涉及语音交互技术领域,具体公开了一种AI智能机器人语音交互方法及系统,旨在解决复杂噪声环境中语音交互准确率低、可靠性不足及权限管控缺失的问题,通过构建包含稳态噪声、冲击噪声及人声干扰特征的动态噪声特征库和预存手势指令库,实时采集音频信号并执行低频段、中频段及高频段差异化降噪,提取梅尔频率倒谱系数特征,匹配噪声场景并切换对应语音识别模型,计算语音指令置信度值,结合动态置信度阈值输出多模态验证数据,通过声纹匹配、权限核验及指令一致性判断输出权限控制信号。本发明通过多模态融合、动态适配及权限管控,显著提升复杂噪声环境下的语音识别准确率与交互安全性,适用于工厂智能巡检等场景。
技术关键词
语音交互方法
梅尔频率倒谱系数
智能机器人
语音识别模型
动态噪声
稳态噪声
冲击噪声
低频段
场景分类
信噪比
手势
噪声样本
音频信号分解
多模态
声纹特征
语音交互系统
系统为您推荐了相关专利信息
感知特征
设备特征
视频播放设备
模态特征
视频评价方法
声纹识别模型
会议记录方法
语音识别模型
发言者
文本
文本
指令
语音识别模型
注意力机制
历史交互信息