一种视频的图像帧处理方法及系统

正文

推荐专利

一种视频的图像帧处理方法及系统

申请号：CN202510234748

申请日期：2025-02-28

公开号：CN120111278A

公开日期：2025-06-06

类型：发明专利

摘要

本发明涉及图像帧处理技术领域，且公开了一种视频的图像帧处理方法及系统，其中的视频的图像帧处理方法包括如下步骤：S1、视频输入：输入视频某一帧，形成图片；S2、低频特征提取：采用全局特征提取器获取图片富含低频信息的特征，形成图片低频特征；S3、特征拼接：采用视频VAE提取潜在空间特征，和视频的带噪音的特征以及文本特征拼接在一起，送入DiT模型中；S4、高频特征提取：采用预训练大模型提取图片物体特征，然后经过MLp层特征学习，形成图片高频特征；S5、高频特征注入；S6、视频生成。本发明设计合理，通过把图片里的高频信息和低频信息分别注入模型的对应位置，以提高生成视频里的物体一致性。

技术关键词

高频特征全局特征提取视频图片特征提取模块注意力人脸特征物体特征提取图像处理技术人脸识别模型模型训练模块关键点拼接模块文本融合特征输入模块轮廓

系统为您推荐了相关专利信息

一种基于人工智能技术的虚拟试衣推荐方法

虚拟试衣人工智能技术服装推荐方法体型

一种基于停留帧的视频文本敏感信息检查方法、系统、设备以及介质

信息检查方法视频深度学习模型序列文本识别

配网不停电作业现场点云与影像数据三维建模方法

影像获取模块三维建模方法三维模型作业现场分析模块

一种高效的临近降水预报方法

降水预报方法空间模块雷达回波数据空间特征信息卷积模块

一种镀膜机镀膜质量的检测方法及系统

反射率数据镀膜机预测误差可视化看板石英晶体传感器

一种视频的图像帧处理方法及系统

站点导航

APP 下载