文本生成大模型的安全护栏增强方法、装置和计算机设备

正文

推荐专利

申请号：CN202411959630

申请日期：2024-12-27

公开号：CN119903524A

公开日期：2025-04-29

类型：发明专利

摘要

本申请涉及一种文本生成大模型的安全护栏增强方法、装置和计算机设备，其中，该方法包括：通过基于预设的训练数据集，对预定义的组合型护栏进行训练，训练过程为：通过组合型护栏中的每个护栏模型，对训练数据集中样本文本生成提示进行识别，得到每个护栏模型对应的输出结果；根据各输出结果，动态调整每个护栏模型对应的权重；通过训练后的组合型护栏对输入的文本生成提示进行处理，得到决策结果；决策结果由每个护栏模型对文本生成提示的处理结果，以及训练后每个护栏模型对应的权重确定。通过本申请，解决了大模型安全护栏防御能力不足，无法有效应对多样化的越狱攻击的问题，实现了提升大模型安全护栏防御能力，以有效应对多样化的越狱攻击。

技术关键词

组合型护栏文本集成学习模型样本决策计算机设备动态数据处理器场景可读存储介质存储器效应模块定义

系统为您推荐了相关专利信息

制冷设备的控制方法、装置和制冷设备

制冷设备地理位置信息样本湿度传感器定位模块

一种刀具磨损状态的在线监测方法

刀具磨损状态机床主轴在线监测方法切削特征在线监控方法

一种数据驱动的电池热故障检测与定位方法

电池热故障检测测地线距离特征值定位方法混合矩阵

基于城市群的绿色物流效率评价分析模型构建方法

分析模型构建方法物流二氧化碳排放量决策评价指标体系

mRNAs标志物在肺印戒细胞癌早期诊断中的应用及试剂盒

风险评分模型试剂盒标志物 mRNA表达谱印戒细胞癌

文本生成大模型的安全护栏增强方法、装置和计算机设备

站点导航

APP 下载