面向安全性优化与高效训练的大语言模型数据选择方法及装置

AITNT
正文
推荐专利
面向安全性优化与高效训练的大语言模型数据选择方法及装置
申请号:CN202510978377
申请日期:2025-07-16
公开号:CN121009332A
公开日期:2025-11-25
类型:发明专利
摘要
本发明涉及大语言模型领域,具体涉及一种面向安全性优化与高效训练的大语言模型数据选择方法及装置。方法包括:将数据选择过程建模为一个双层优化问题,所述双层优化包括内层优化和外层优化;构建具备安全感知能力的数据选择器,基于数据选择器对原始数据进行排序,优先选取高质量且安全关键的核心数据子集;将所述核心数据子集作为输入数据,与预设的对齐技术结合,用于大语言模型的安全对齐训练;在对齐后的模型基础上,使用用户提供的微调数据执行最终训练,得到具备安全性保障的目标模型。本发明在提升模型推理性能与安全防御能力的同时,显著降低了训练时间,解决了现有防御方法对数据质量依赖性高、计算开销大的问题。
技术关键词
数据选择器 大语言模型 对齐技术 计算机程序指令 核心 参数 模块 模拟模型 电子设备 处理器通信 样本 可读存储介质 关键性 基础 存储器 鲁棒性
系统为您推荐了相关专利信息
1
融合大语言模型的跨模态交易特征自生成与异常检测系统及方法
交易特征 异常检测系统 大语言模型 跨模态 语义向量
2
时间敏感型问题的检索增强生成方法及数据集生成方法
生成方法 大语言模型 语义 卡片 生成答案
3
一种面向大语言模型的动态广告投放方法及系统
动态广告投放方法 大语言模型 自然语言 强化学习策略 动态上下文
4
医学影像报告的危急值预警方法、装置及存储介质
报告 异常信息 大语言模型 文本 匹配模块
5
一种多层金属结构差分信号传输线、阵列及芯片
信号传输线 多层金属结构 通孔 集成电路芯片 工艺平台
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号