一种基于网格图的视频描述生成方法、系统及存储介质

正文

推荐专利

申请号：CN202510300684

申请日期：2025-03-14

公开号：CN119815139B

公开日期：2025-06-03

类型：发明专利

摘要

本发明提供了一种基于网格图的视频描述生成方法，包括：S101、获取原始视频V；S102、从获取的原始视频V中等间距抽取k帧第一图像；其中，k应当满足被开平方；每一帧第一图像的大小为W×H×C；S103、构建一张大小为W×H×C的空图I，将空图I划分为个大小为W×H×C的块；S104、将k帧第一图像由左至右、由上至下，顺序置于空图I的k个大小为W×H×C的块中，得到大小为W×H×C的第二图像；S105、将得到大小为W×H×C的第二图像调整成大小为T×T×C的第三图像；S106、将大小为T×T×C的第三图像和生成类文本一起输入到LVLM模型中，输出生成的视频描述。本发明减少视频描述生成的计算复杂度，保证了视频描述的生成质量。

技术关键词

生成方法视频图像计算机执行指令光流特征计算机存储介质生成系统深度学习模型网格间距文本复杂度通道坐标

一种基于网格图的视频描述生成方法、系统及存储介质

站点导航

APP 下载