一种驱动说话人面部特征高还原方法、装置

AITNT
正文
推荐专利
一种驱动说话人面部特征高还原方法、装置
申请号:CN202411436768
申请日期:2024-10-15
公开号:CN118941682A
公开日期:2024-11-12
类型:发明专利
摘要
本发明提供了一种驱动说话人面部特征高还原方法、装置,涉及面部特征还原技术领域,该方法包括三个步骤,获取说话人的15个口腔关键帧,驱动说话人模型,使用wenet提取音频的特征;并且在训练阶段引入关键点损失函。使得该方法在实际使用时,驱动说话人能够保持每一帧画面对原始视频口腔形态的高度还原,并且在静音时段,能够自然闭嘴,保持面部和嘴巴动作的协调。以解决现有技术说话人的口腔与本人的口腔不一致,和失真的问题。
技术关键词
说话人模型 关键帧 面部特征 还原方法 视频 对齐模块 人脸关键点检测 音频特征 还原装置 形态 图像编码 多边形 指标 解码模块 模型预测值
系统为您推荐了相关专利信息
1
一种用于Type-C接口的视频信号传输电路
视频信号传输电路 视频信号接收芯片 无线信号发射电路 无线信号接收电路 信号编码电路
2
一种LED屏播控安全管理系统及方法、LED屏
识别神经网络 图像还原 存储单元 管理方法 图像局部特征
3
基于人体分割网络和跌倒分类模型的人员跌倒检测方法
跌倒检测方法 人体轮廓 分类模型训练 标注工具 文件夹
4
一种基于文本特征引导的动态参数调整小样本行为识别方法
文本 矩阵 参数 识别方法 视频帧
5
一种基于轨迹编辑和图像翻译的驾驶场景数据增强方法
驾驶场景数据 翻译模型 图像 编辑 交通
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号