摘要
本发明涉及音频算法技术领域,揭示了一种根据语音环境实现定向透传的方法、装置及语音交互设备,通过麦克风阵列定向识别使用者周围设定距离内的人声;获取使用者状态信息,包括头部动作和语音反馈;根据人声和状态信息判断使用者是否进行语音交流;当判断使用者正在交流时,形成定向收音场,定向放大交流者的人声。该发明实现了精准定向收音,通过波束成形技术精确识别并放大人声,避免环境噪声干扰;实现智能化操作,自动识别语音交流场景,无需手动切换模式;提升语音清晰度,定向放大人声,确保语音交流的清晰度和舒适性,解决了现有语音交互设备在交流场景中需手动切换模式且噪声干扰的技术问题。
技术关键词
语音交互设备
人声
麦克风阵列
波束成形技术
状态检测单元
音频算法技术
环境噪声干扰
陀螺仪
场景
模式
信号
处理器
运动
系统为您推荐了相关专利信息
人工智能决策
远场拾音
语音活动检测
控制策略
估计信噪比
交互通信系统
大语言模型
梅尔频率倒谱系数
Sigmoid函数
动态反馈机制
视觉监测方法
语音分析设备
视觉检测装置
视觉检测模块
负荷
信噪比
数据处理模块
深度学习模型
音频信号处理方法
计算机可读取存储介质
多声道音频系统
对数扫频信号
追踪算法
Lagrange插值法
声学特征