文本生成视频模型的训练方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510546335

申请日期：2025-04-28

公开号：CN120529143A

公开日期：2025-08-22

类型：发明专利

摘要

本申请涉及一种文本生成视频模型的训练方法、装置、设备及存储介质。本申请在文本生成视频模型的训练过程，通过引入视频评估模型，对初始文本生成视频模型生成的目标视频进行质量评估，生成视频质量信息，进而通过该视频质量信息，即可更新初始文本生成视频模型的模型参数，生成训练后的目标文本生成视频模型；通过该方式，可利用视频评估模型替代人工打分，大幅减少人工参与度，降低人力成本与时间成本；并且，该方式还可避免人工主观差异带来的评分波动，生成准确的视频质量信息，有助于训练稳定收敛。

技术关键词

视频文本强化学习算法计算机可执行指令计算机存储介质艺术性特征通信接口参数存储器美学训练装置数据处理器模块视觉分辨率电子设备语义色彩分层

系统为您推荐了相关专利信息

调窗参数的预测方法、装置、设备及存储介质

编码特征信息编码影像序列参数

一种动作识别方法、装置、计算机设备及存储介质

动作识别方法空间注意力网络图片动作识别模型注意力机制

一种基于直接起爆模式的起爆方法及系统

电子雷管起爆方法文本识别模型发射终端模式

波物理洞见驱动的高超声速目标模式识别方法

模式识别方法特征值面片特征向量库计算机可执行指令

一种点云视频传输方法及系统

视频传输方法重建点云判决模块 3D点云联合损失函数

文本生成视频模型的训练方法、装置、设备及存储介质

站点导航

APP 下载