基于参考图像的视频生成方法、装置、设备、介质和产品

正文

推荐专利

申请号：CN202510953667

申请日期：2025-07-10

公开号：CN120455807B

公开日期：2025-10-17

类型：发明专利

摘要

本公开实施例公开了一种基于参考图像的视频生成方法、装置、设备、介质和产品，方法包括：获取的文本信息和包括目标视频的主角对象的多帧参考图像对文本信息进行编码处理得到文本特征，对各参考图像进行图像特征提取得到各参考图像的图像特征，对各图像特征进行拼接处理得到拼接特征，基于拼接特征、文本特征和预设噪声，利用预先训练的视频生成模型进行预设个时间步的去噪处理，生成针对主角对象的目标视频。由此在生成目标视频时，视频生成模型可以同时关注到文本特征和拼接特征，可以更好的学习到主角对象和文本信息，生成关于主角对象的目标视频，提升了用户体验。

技术关键词

键特征视频生成模型查询特征融合特征图像特征提取标签文本视频生成方法噪声计算机程序指令样本对象交叉注意力机制视频生成装置模块存储计算机程序

系统为您推荐了相关专利信息

一种遥感图像超分辨率重建方法

交叉注意力机制语义特征矩阵输出特征分支

基于GAF的调距桨液压系统多模态故障诊断方法及系统

调距桨液压系统俯仰指令故障诊断方法故障诊断系统多模态

音频生成方法、装置、设备及计算机可读存储介质

视频噪声特征文本音频生成方法音频特征

一种医疗辅助智能机械人及智慧医疗系统

智能机械人分类识别模型执行交互指令智慧医疗系统生成上下文感知

基于梯度特征提取与多阶段融合的地图检测方法及系统

融合特征跨尺度特征融合分层特征归一化模块局部细节特征

基于参考图像的视频生成方法、装置、设备、介质和产品

站点导航

APP 下载