摘要
本发明公开了基于多语言适配与个性化定制技术的数字人唇形合成系统,属于数字人技术领域,包括多维信息获取模块和信息处理模块;本发明中,通过在内设置有唇部运动轨迹合成模块,该模块不仅能够对于音频进行唇形合成,同时能够将音频转换为文本信息,能够使得数字人能够针对于音频、文本进行唇形合成,同时,系统内还针对于方言语音进行了优化,使得数字人还能够识别方言,进行唇形合成,系统内设置有唇形动画生成模块,能够对于音频与唇形运动轨迹的时间戳进行一一对应,能够极大的保证音频与唇形的同步,提高数字人的真实度,同时系统内还提供个性化定制功能,用户能够根据自己的喜好对于数字人进行设定,提高了该系统的交互效果。
技术关键词
定制技术
多语言
输入端
唇形动画
信息处理模块
音频
机器深度学习
唇形特征
特征点
个性化定制功能
交互终端
面部特征
数据分类
测试模块
异常数据
虚拟现实设备
识别方言
计算机图形学
文本
系统为您推荐了相关专利信息
LED驱动芯片
开关电路
主控电路
电压检测电路
供电电压值
语义分割模型
车辆可行驶区域
语义分割网络
样本
空洞
固件存储系统
系统配置信息
加载器
非易失性存储芯片
镜像
数字孪生模型
状态更新
高速铁路基础设施
元件
编码方法
外设时钟
系统时钟信号
释放器
管理装置
时钟使能信号