视频生成方法、装置、智能体、电子设备及存储介质

正文

推荐专利

申请号：CN202511319343

申请日期：2025-09-15

公开号：CN121000951A

公开日期：2025-11-21

类型：发明专利

摘要

本公开公开一种视频生成方法，人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于数字人等场景。该方法包括：提取目标音频的目标音频特征和参考图像中虚拟形象的虚拟形象特征；基于注意力机制，对目标音频特征和初始视频特征进行处理，得到目标视频特征，初始视频特征由虚拟形象特征与随机噪声拼接形成；以及对目标视频特征进行解码处理，得到目标视频，其中，目标视频包括虚拟形象基于目标音频言语表达的视频帧。本公开还提供了一种视频生成装置、智能体、电子设备及存储介质。

技术关键词

音频特征注意力机制视频生成方法时序随机噪声视频生成装置视频帧电子设备输入模块关系处理器图像人工智能技术计算机程序产品计算机视觉解码

系统为您推荐了相关专利信息

一种用于电铲制动器状态实时监测方法

重载工况状态实时监测方法演化特征电铲制动盘表面

目标识别方法、装置、设备和存储介质

样本识别方法识别模型训练特征提取模块识别标签

一种基于时序控制的脉冲激光协同加工控制方法

机器人运动参数控制机器人运动脉冲激光器时序运动补偿

一种基于细节增强的医学图像超分辨率重建方法

肺部CT图像特征提取模块纹理细节特征 CT重建图像解码器

基于3D深度可分离卷积和EAM模块融合的医学图像分割方法

医学图像分割方法阶段输出特征解码器分辨率

视频生成方法、装置、智能体、电子设备及存储介质

站点导航

APP 下载