一种语音驱动的高效果的数字人口型合成算法

AITNT
正文
推荐专利
一种语音驱动的高效果的数字人口型合成算法
申请号:CN202510191308
申请日期:2025-02-20
公开号:CN120034700A
公开日期:2025-05-23
类型:发明专利
摘要
本发明涉及一种语音驱动的高效果的数字人口型合成算法,通过引入lip‑reading expert、重新设计的lip‑sync expert、创新的参考帧选择策略、精心设计的双向特征融合模块和训练损失函数等技巧来提高数字人口型合成的效果。并且具备可控张嘴幅度和多语言支持的功能。
技术关键词
音频特征 音频编码器 生成对抗网络 图像编码器 语音 图像解码器 算法 注意力 表达式 多模态信息融合 短视频 人脸关键点 画面 代表 模块 人脸图片
系统为您推荐了相关专利信息
1
一种基于惯性测量单元特征融合的语音识别方法
语音识别方法 陀螺仪 Sigmoid函数 注意力 融合特征
2
用于辅导的方法、电子设备及计算机可读存储介质
情感分析模型 偏好特征 语音生成模型 可读存储介质 电子设备
3
使用多模态大型语言模型进行分类
文本编码器 预测特征 查询特征 多模态 生成图像特征
4
基于大数据的旅游景区推荐方法及系统、设备、存储介质
景区推荐方法 项目 大数据 语音特征 平台
5
一种用于抑郁状态监测的数据方法
情绪特征 抑郁 数据 深度学习模型 心理健康状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号