摘要
本发明涉及分层语义调整技术领域,公开了一种安全可控视频生成方法和系统;方法包括:对用户输入的文本提示和有害概念文本分别进行编码,得到文本提示特征和有害概念特征;将有害概念特征分解为多个独立的语义方向,并计算文本提示特征在不同语义方向上的投影系数及投影方差;构建并融合语义分布权重与概念结构权重,对文本提示特征进行缩放调整,得到移除有害语义后的安全文本特征;以安全文本特征为条件,在视频潜在空间中进行多步迭代去噪,预测并去除噪声,得到去噪后的视频潜在空间表示;将去噪后的视频潜在空间表示映射至原始视频空间,生成最终的安全视频。本发明能够显著降低视频生成中的安全风险。
技术关键词
文本
视频生成方法
噪声估计器
概念
视频生成系统
融合语义
矩阵
大语言模型
超参数
解码器
解码模块
编码模块
强度
索引
元素
动态