基于文本嵌入优化的文生图模型敏感内容过滤和防御方法

正文

推荐专利

申请号：CN202411365727

申请日期：2024-09-29

公开号：CN119538238A

公开日期：2025-02-28

类型：发明专利

摘要

本发明公开了一种基于文本嵌入优化的文生图模型敏感内容过滤和防御方法，涉及大模型安全技术领域。该方法包括：准备正负样本数据集和普通数据集；调整文本编码器的参数并利用师生模型进行训练；使用普通数据集稳定文本编码器；设计一个综合损失函数，结合多个数据集进行训练优化以生成调整后的学生模型并通过文本嵌入生成最终的安全图像。本发明通过微调文本编码器，在处理包含敏感词汇的文本输入时，将这些敏感词汇的文本嵌入转换为对应良性词汇的文本嵌入并使用良性的文本嵌入来引导生成安全图像；在不改变模型生成能力的前提下避免文生图模型生成包含敏感色情或其他受版权保护的图像，实现对敏感内容的有效过滤、转换及防御。

技术关键词

文本编码器样本学生大语言模型教师数据概念图像定义参数对象词语语句

系统为您推荐了相关专利信息

一种基于LLM的电力工控网络仿真验证场景生成方法

解码器网络拓扑结构特征场景生成方法输出告警信息矩阵

一种用于音视频的模型推理方法、装置及电子设备

音视频数据决策样本推理方法

一种基于多维度特征匹配的网络流量智能清洗方法、系统及介质

智能清洗方法应用层协议特征智能清洗系统融合策略数据

一种新词的发现方法、系统及计算机可读存储介质

话题大语言模型网络平台模版样本

考虑样本不平衡处理的异常配电变压器识别方法及设备

配电变压器识别方法样本群智能算法数据分类

基于文本嵌入优化的文生图模型敏感内容过滤和防御方法

站点导航

APP 下载