摘要
本发明涉及语音识别技术领域,具体涉及一种基于语音识别的数字人驱动方法、设备及系统,该方法包括:获取目标区域的各声源的音频数据;确定属于交互用户的语音的目标独立成分语音;确定相似语音组;根据第一目标独立成分语音的第一采集时刻、第二目标独立成分语音的第二采集时刻以及声音传播速度,确定交互用户到第一位置的第一参考位置以及交互用户到第二位置的第二参考位置之间的距离差;根据第一参考位置与第二参考位置之间的距离以及距离差确定交互用户的目标位置;利用交互用户在目标区域内的目标位置驱动数字人面向交互用户。如此,本发明提高了数字人与观众的交互灵活性,保证了观众在交互的过程中的参与感,提高了观众的互动体验感。
技术关键词
声音采集设备
声音传播速度
驱动方法
音频
频率
独立成分分析
序列
有效性
驱动设备
语音识别技术
数据
极值
连线
文本
模块
存储器
分词
线段
处理器
系统为您推荐了相关专利信息
编码特征
数据压缩方法
算术编码器
解码模型
联合损失函数
聚类分析方法
神经网络训练
波形
保边去噪方法
分类计算方法