摘要
本发明公开了一种视频生成模型训练数据集处理方法,属于视频处理领域。S1、将经具体业务方向收集的视频存放于单一指定文件夹中,所述视频在时长、分辨率及帧率方面无固定限制;S2、提取所述S1中视频文件名、帧率、时长、分辨率和高宽比,并将所述数据记录于CSV文件中;S3、根据所述S2所述信息,对每个视频实施下列筛选:视频分辨率低于360P时删除;视频高宽比小于0.7时删除;视频帧率低于20帧每秒时删除;S4、对所述S3中筛选后的视频采用PySceneDetect算法进行场景切分。本发明能够从大量原始视频中均匀地提取出具有代表性和动态变化的核心帧,从而提高视频数据集的多样性和质量,为视频生成模型提供高质量的训练数据。
技术关键词
视频生成模型
分辨率
视频帧
字幕
切片
数据
文本
算法
生成短视频
检测工具
关键帧
文件夹
水印
视觉
核心
场景
元素
运动
系统为您推荐了相关专利信息
高分辨率遥感图像
遥感图像语义分割
语义分割网络
遥感图像数据
梯度下降法
图像分割方法
感兴趣
图像分割装置
推理算法
掩膜
知识库构建方法
树形结构
动态切片
文本
语义理解模型
矩阵
性能优化方法
切片
非暂态计算机可读存储介质
指令