摘要
本申请涉及一种文本生成视频模型的训练方法、装置、设备及存储介质。本申请在文本生成视频模型的训练过程,通过引入视频评估模型,对初始文本生成视频模型生成的目标视频进行质量评估,生成视频质量信息,进而通过该视频质量信息,即可更新初始文本生成视频模型的模型参数,生成训练后的目标文本生成视频模型;通过该方式,可利用视频评估模型替代人工打分,大幅减少人工参与度,降低人力成本与时间成本;并且,该方式还可避免人工主观差异带来的评分波动,生成准确的视频质量信息,有助于训练稳定收敛。
技术关键词
视频
文本
强化学习算法
计算机可执行指令
计算机存储介质
艺术性特征
通信接口
参数
存储器
美学
训练装置
数据
处理器
模块
视觉
分辨率
电子设备
语义
色彩
分层
系统为您推荐了相关专利信息
动作识别方法
空间注意力网络
图片
动作识别模型
注意力机制
模式识别方法
特征值
面片
特征向量库
计算机可执行指令
视频传输方法
重建点云
判决模块
3D点云
联合损失函数