摘要
本申请公开了一种基于用户偏好的文生视频扩散模型的训练方法及装置,所述方法包括:获取用户的文本数据并将其输入文本精炼模型进行处理,获得精炼文本数据;将精炼文本数据输入初始文生视频扩散模型,获得多个初始视频;将多个初始视频输入预先训练得到的用户偏好对齐模型,获得与用户偏好对齐的最优视频;基于最优视频对文生视频扩散模型进行训练,获得目标文生视频扩散模型。本申请利用帮助性与安全性偏好数据集来对齐文本生成视频模型,使用数据训练奖励模型和审核模型。通过两个模型筛选最优安全生成结果作为监督信号来训练优化文生视频扩散模型。使文生视频扩散模型提高帮助性的同时,安全性能够符合人类的期望。
技术关键词
视频
审核模型
安全性标签
文本
数据
模型更新
可读存储介质
大语言模型
对齐模块
训练装置
电子设备
处理器
指令
存储器
计算机
噪声
参数
人类
关系
系统为您推荐了相关专利信息
检测工业
缺陷检测单元
像素点
坐标
深度学习网络模型
损伤评估方法
轻量化神经网络
相关系数阈值
化工管道
数据