摘要
一种基于声源定位的数字人目光随动方法,属于数字人及计算机程序技术领域,通过引入麦克风阵列,通过声源定位算法,来获取对话方或者环境中能够吸引人注意力的声音的位置,并驱动数字人做出相应的反应。本发明的优点是:借助于麦克风阵列进行目标声源方位的推断,进而实现数字人对于对话方的目光跟随,能够让对话方与用户在交互过程中感受到更加真实的体验。借助于麦克风阵列,可以通过语音进行多个对话方之间的目光切换。
技术关键词
麦克风阵列
声音定位模块
语音
声源定位算法
播放设备
方位角
计算机程序技术
视频
生成数字人
运动
标签
注意力
矩阵
音频
显示设备
扩音器
年龄
面部
系统为您推荐了相关专利信息
数据预处理方法
音频分块
语言数据处理技术
特征提取能力
场景
非线性动力学建模
李雅普诺夫指数
建模方法
声纹特征
面部
实时路况
电子外后视镜
行驶环境信息
生成控制指令
车辆运动轨迹