面向安全性优化与高效训练的大语言模型数据选择方法及装置

正文

推荐专利

申请号：CN202510978377

申请日期：2025-07-16

公开号：CN121009332A

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及大语言模型领域，具体涉及一种面向安全性优化与高效训练的大语言模型数据选择方法及装置。方法包括：将数据选择过程建模为一个双层优化问题，所述双层优化包括内层优化和外层优化；构建具备安全感知能力的数据选择器，基于数据选择器对原始数据进行排序，优先选取高质量且安全关键的核心数据子集；将所述核心数据子集作为输入数据，与预设的对齐技术结合，用于大语言模型的安全对齐训练；在对齐后的模型基础上，使用用户提供的微调数据执行最终训练，得到具备安全性保障的目标模型。本发明在提升模型推理性能与安全防御能力的同时，显著降低了训练时间，解决了现有防御方法对数据质量依赖性高、计算开销大的问题。

技术关键词

数据选择器大语言模型对齐技术计算机程序指令核心参数模块模拟模型电子设备处理器通信样本可读存储介质关键性基础存储器鲁棒性

系统为您推荐了相关专利信息

一种低空空域无人机精准管控系统及方法

无人机管控平台合作无人机防护设备数据通信单元信号

基于结构化多源信息融合的SCADA系统标签生成方法及系统

SCADA系统多源信息融合系统标签标签文件生成方法

一种面向动态决策的注意力情境表征方法与装置

情境要素表征方法注意力数据度函数

虚拟机迁移方法、装置、设备、存储介质及程序产品

虚拟机迁移方法内存集群总量计算机程序指令

冗余机械臂的轨迹规划与优化控制方法

机械臂末端执行器优化控制方法神经网络求解器驱动关节驱动机械臂

面向安全性优化与高效训练的大语言模型数据选择方法及装置

站点导航

APP 下载