摘要
本申请提供了一种模型训练方法、视频生成方法、电子设备及存储介质,涉及大模型技术、数据处理技术领域。其中,该方法包括:获取训练提示文本;采用初始视频生成模型对训练提示文本进行视频生成处理,得到多个候选视频;从多个维度对多个候选视频进行视频偏好评估,得到评估结果,其中,多个维度至少包括:动态视觉维度,评估结果至少用于评估动态视觉维度关联的多个运动对象的运动幅度;基于评估结果对初始视频生成模型进行训练,生成目标视频生成模型,其中,目标视频生成模型用于对输入文本进行视频生成处理以得到目标视频。本申请解决了相关技术中提供的视频生成方式的输出视频存在运动丰富度低、真实性差的技术问题。
技术关键词
视频生成模型
模型训练方法
视频生成方法
文本
视频采集设备
样本
应用程序编程接口
运动
操作界面
矫正
视频生成系统
可读存储介质
视觉
图形用户界面
客户端
电子设备
对象
动态
数据处理技术
系统为您推荐了相关专利信息
智能生成方法
智能生成系统
文本
图像嵌入
大语言模型
居民用电
解析方法
特征信息融合
预训练语言模型
分词模型
信用评估方法
金融时序数据
指标
风险
企业关联关系图谱