基于语音识别的数字人驱动方法、设备及系统

正文

推荐专利

申请号：CN202411533753

申请日期：2024-10-31

公开号：CN119049476B

公开日期：2025-03-28

类型：发明专利

摘要

本发明涉及语音识别技术领域，具体涉及一种基于语音识别的数字人驱动方法、设备及系统，该方法包括：获取目标区域的各声源的音频数据；确定属于交互用户的语音的目标独立成分语音；确定相似语音组；根据第一目标独立成分语音的第一采集时刻、第二目标独立成分语音的第二采集时刻以及声音传播速度，确定交互用户到第一位置的第一参考位置以及交互用户到第二位置的第二参考位置之间的距离差；根据第一参考位置与第二参考位置之间的距离以及距离差确定交互用户的目标位置；利用交互用户在目标区域内的目标位置驱动数字人面向交互用户。如此，本发明提高了数字人与观众的交互灵活性，保证了观众在交互的过程中的参与感，提高了观众的互动体验感。

技术关键词

声音采集设备声音传播速度驱动方法音频频率独立成分分析序列有效性驱动设备语音识别技术数据极值连线文本模块存储器分词线段处理器

系统为您推荐了相关专利信息

一种基于深度学习的自适应数据压缩方法

编码特征数据压缩方法算术编码器解码模型联合损失函数

一种安全文化提升措施生成方法与系统

大语言模型措施分析单元生成系统模块

将应用作为元素植入思维导图的AI装置及方法

节点元素模块人工智能语义分析全屏手写

一种基于深度学习的AI芯片测试参数自适应优化方法

非线性映射关系物理状态参数模式图谱芯片

一种基于多频率数据体的地震波形分类计算方法

聚类分析方法神经网络训练波形保边去噪方法分类计算方法

基于语音识别的数字人驱动方法、设备及系统

站点导航

APP 下载