一种基于声源定位的数字人目光随动方法

AITNT
正文
推荐专利
一种基于声源定位的数字人目光随动方法
申请号:CN202510748975
申请日期:2025-06-06
公开号:CN120892007A
公开日期:2025-11-04
类型:发明专利
摘要
一种基于声源定位的数字人目光随动方法,属于数字人及计算机程序技术领域,通过引入麦克风阵列,通过声源定位算法,来获取对话方或者环境中能够吸引人注意力的声音的位置,并驱动数字人做出相应的反应。本发明的优点是:借助于麦克风阵列进行目标声源方位的推断,进而实现数字人对于对话方的目光跟随,能够让对话方与用户在交互过程中感受到更加真实的体验。借助于麦克风阵列,可以通过语音进行多个对话方之间的目光切换。
技术关键词
麦克风阵列 声音定位模块 语音 声源定位算法 播放设备 方位角 计算机程序技术 视频 生成数字人 运动 标签 注意力 矩阵 音频 显示设备 扩音器 年龄 面部
系统为您推荐了相关专利信息
1
一种针对多语种、复杂场景下的语言数据预处理方法
数据预处理方法 音频分块 语言数据处理技术 特征提取能力 场景
2
一种语音驱动数字人口型的方法
非线性动力学建模 李雅普诺夫指数 建模方法 声纹特征 面部
3
一种用于变道辅助的电子外后视镜控制方法及系统
实时路况 电子外后视镜 行驶环境信息 生成控制指令 车辆运动轨迹
4
语音合成方法、语音合成模型训练方法及相关装置
样本 注意力 音频特征 子模块 声纹验证系统
5
语音交互、模型训练方法、装置、设备及产品
样本 信号 音频特征 滑动窗口 模型训练方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号