一种基于声源定位的数字人目光随动方法

正文

推荐专利

一种基于声源定位的数字人目光随动方法

申请号：CN202510748975

申请日期：2025-06-06

公开号：CN120892007A

公开日期：2025-11-04

类型：发明专利

摘要

一种基于声源定位的数字人目光随动方法，属于数字人及计算机程序技术领域，通过引入麦克风阵列，通过声源定位算法，来获取对话方或者环境中能够吸引人注意力的声音的位置，并驱动数字人做出相应的反应。本发明的优点是：借助于麦克风阵列进行目标声源方位的推断，进而实现数字人对于对话方的目光跟随，能够让对话方与用户在交互过程中感受到更加真实的体验。借助于麦克风阵列，可以通过语音进行多个对话方之间的目光切换。

技术关键词

麦克风阵列声音定位模块语音声源定位算法播放设备方位角计算机程序技术视频生成数字人运动标签注意力矩阵音频显示设备扩音器年龄面部

系统为您推荐了相关专利信息

一种针对多语种、复杂场景下的语言数据预处理方法

数据预处理方法音频分块语言数据处理技术特征提取能力场景

一种语音驱动数字人口型的方法

非线性动力学建模李雅普诺夫指数建模方法声纹特征面部

一种用于变道辅助的电子外后视镜控制方法及系统

实时路况电子外后视镜行驶环境信息生成控制指令车辆运动轨迹

语音合成方法、语音合成模型训练方法及相关装置

样本注意力音频特征子模块声纹验证系统

语音交互、模型训练方法、装置、设备及产品

样本信号音频特征滑动窗口模型训练方法

一种基于声源定位的数字人目光随动方法

站点导航

APP 下载