一种人脸关键点运动图像生成方法以及相关设备

正文

推荐专利

申请号：CN202411117852

申请日期：2024-08-15

公开号：CN118644596B

公开日期：2024-12-27

类型：发明专利

摘要

本申请公开了一种人脸关键点运动图像生成方法以及相关设备，可以获取参考图像帧，并调用人脸关键点预测模型提取参考图像帧中人脸对应的人脸关键点信息；获取目标音频，并调用音频特征模型提取目标音频的目标音频特征；基于预设窗口尺寸，从目标音频特征中截取待处理音频特征，并获取待处理音频特征对应的至少一个前序图像帧；基于待添加噪声、迭代过程对应的时间步数值、人脸关键点信息、待处理音频特征、以及前序图像帧，调用扩散网络模型通过多次迭代过程预测参考图像帧在目标音频下的人脸关键点运动图像。本申请可生成自然且准确的人脸关键点运动图像。

技术关键词

人脸关键点运动图像生成方法音频特征样本网络数值音频编码器运动图像生成装置视频噪声图像可读存储介质计算机程序产品处理器

系统为您推荐了相关专利信息

基于地质雷达监测技术的市政道路管理方法

模拟滤波器道路缺陷检测市政道路管理参数地质雷达

融合多头注意力机制的PointGroup点云分割方法

多头注意力机制分割方法语义标签特征提取网络前馈神经网络

一种基于人工智能技术的低维材料制备实验平台

中央控制单元智能控制系统工艺参数优化算法人工智能技术气相沉积设备

一种基于云边协同的LLM服务平台部署方法和系统

多轮对话数据中心共识算法节点云端

数据处理方法、装置、设备、存储介质及计算机程序产品

节点账号资源数据处理方法计算机程序产品

一种人脸关键点运动图像生成方法以及相关设备

站点导航

APP 下载