基于多模态融合与一致性约束的数字人唇形驱动方法

AITNT
正文
推荐专利
基于多模态融合与一致性约束的数字人唇形驱动方法
申请号:CN202510654476
申请日期:2025-05-21
公开号:CN120656218A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了基于多模态融合与一致性约束的数字人唇形驱动方法,属于数字人生成领域,包括以下步骤:S1、以参考人脸图像为输入构建多模态特征提取与表示框架,并基于构建的多模态特征提取与表示框架生成个性化人脸特征表示;S2、利用QKV一致性约束驱动个性化人脸特征表示和语音特征进行动态耦合,生成语音驱动下的唇形动作;S3、利用离散编码对参考视频编码得到离散特征,并基于Lipschitz连续性约束机制限制编码空间的变化范围,优化唇形动作。采用上述基于多模态融合与一致性约束的数字人唇形驱动方法,在语音驱动一致性、局部细节还原以及整体生成质量上实现全面提升,显著改善了生成唇形动作的微观动态表现和细节保真度。
技术关键词
参数化特征 驱动方法 人脸特征 多模态 语音特征 离散特征 高频特征 键特征 视频编码 连续性 查询特征 生成语音 动态 个性化特征 编码器 表达式 图像 语义
系统为您推荐了相关专利信息
1
多模态农作物知识图谱的实体对齐方法
实体对齐方法 特征匹配网络 多模态 图谱拓扑结构 融合特征
2
显示装置的驱动方法和驱动装置、显示装置
发光单元 像素单元 面板 显示装置 亮度
3
一种基于多模态小样本学习的场景分割方法及系统
场景分割方法 语义特征提取 多模态 实时视频流 通道校正
4
一种基于视觉语言先验的人脸超分辨率方法、系统及及计算机设备
人脸超分辨率方法 低分辨率人脸图像 人脸特征 高分辨率人脸图像 视觉先验信息
5
一种基于TVFNet网络模型的作物病虫害分割检测方法
分割检测方法 作物叶片图像 作物病虫害 双分支结构 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号