文本生成大模型的安全护栏增强方法、装置和计算机设备

AITNT
正文
推荐专利
文本生成大模型的安全护栏增强方法、装置和计算机设备
申请号:CN202411959630
申请日期:2024-12-27
公开号:CN119903524A
公开日期:2025-04-29
类型:发明专利
摘要
本申请涉及一种文本生成大模型的安全护栏增强方法、装置和计算机设备,其中,该方法包括:通过基于预设的训练数据集,对预定义的组合型护栏进行训练,训练过程为:通过组合型护栏中的每个护栏模型,对训练数据集中样本文本生成提示进行识别,得到每个护栏模型对应的输出结果;根据各输出结果,动态调整每个护栏模型对应的权重;通过训练后的组合型护栏对输入的文本生成提示进行处理,得到决策结果;决策结果由每个护栏模型对文本生成提示的处理结果,以及训练后每个护栏模型对应的权重确定。通过本申请,解决了大模型安全护栏防御能力不足,无法有效应对多样化的越狱攻击的问题,实现了提升大模型安全护栏防御能力,以有效应对多样化的越狱攻击。
技术关键词
组合型护栏 文本 集成学习模型 样本 决策 计算机设备 动态 数据 处理器 场景 可读存储介质 存储器 效应 模块 定义
系统为您推荐了相关专利信息
1
制冷设备的控制方法、装置和制冷设备
制冷设备 地理位置信息 样本 湿度传感器 定位模块
2
一种刀具磨损状态的在线监测方法
刀具磨损状态 机床主轴 在线监测方法 切削特征 在线监控方法
3
一种数据驱动的电池热故障检测与定位方法
电池热故障检测 测地线距离 特征值 定位方法 混合矩阵
4
基于城市群的绿色物流效率评价分析模型构建方法
分析模型构建方法 物流 二氧化碳排放量 决策 评价指标体系
5
mRNAs标志物在肺印戒细胞癌早期诊断中的应用及试剂盒
风险评分模型 试剂盒 标志物 mRNA表达谱 印戒细胞癌
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号