摘要
本申请实施例提供了一种模型训练方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,属于视频处理领域。该模型训练方法包括:获取第一视频帧、第二视频帧、第三视频帧和光流掩码图;其中,所述第一视频帧、第二视频帧和第三视频帧为依序分布的连续视频帧且均具有目标文本,所述光流掩码图用于指示所述目标文本在帧画面上的位置;将所述第一视频帧、第三视频帧和所述光流掩码图作为模型输入,通过所述插帧模型输出预测视频帧;根据所述预测视频帧和所述第二视频帧,调整所述插帧模型。本申请实施例的技术方案可以在生成预测视频帧时更准确地保持文本前景的静止特性,减少文本因背景运动而产生的形变,可以提高插帧的准确性和视觉效果。
技术关键词
视频帧
模型训练方法
像素
文本
计算机程序产品
可读存储介质
数值
插帧方法
模型训练装置
计算机设备
输出模块
依序
画面
处理器通信
指令
存储器
系统为您推荐了相关专利信息
Lab色彩空间
子模块
分区
双线性插值算法
像素点
车辆周围环境信息
意图类别
车载人机交互方法
乘员
语音
融合特征
遥感图像语义分割
调制特征
频域特征提取
多尺度特征融合