基于分组自我博弈和自适应加权的大模型微调方法及装置

AITNT
正文
推荐专利
基于分组自我博弈和自适应加权的大模型微调方法及装置
申请号:CN202511206228
申请日期:2025-08-27
公开号:CN120745757B
公开日期:2025-11-18
类型:发明专利
摘要
本发明提供一种基于分组自我博弈和自适应加权的大模型微调方法及装置,涉及自然语言处理技术领域。该方法包括:根据大语言模型构建对手团队生成模型响应,根据输入数据、目标响应和模型响应构建偏好数据集;构建主力团队,定义主力团队成员的评分函数,根据偏好数据集和评分函数构建损失函数;根据主力团队中的每个队员对目标响应的评分得到目标响应在损失函数中的自适应权重;根据每个队员对目标响应的评分和对模型响应的评分定义偏好边距,计算每个队员的权重,构建最终的损失函数,对大语言模型进行迭代微调。本发明提出了一种新的大语言模型微调算法,它分别通过基于分组的自我博弈和双重自适应权重调节来增强大语言模型的对齐效果。
技术关键词
团队 微调方法 大语言模型 计算机可读取存储介质 数据 计算机可读指令 前三轮 样本 问答系统 机器翻译 微调装置 人类 控制权 定义 文本 参数 摘要 自然语言 意图 处理器
系统为您推荐了相关专利信息
1
一种眼科患者术后康复智能监护系统
智能监护系统 子模块 患者术后康复 眼压 动态贝叶斯网络
2
一种电网设备安全运行状态的实时监控方法及系统
电网设备 剩余寿命预测模型 因子权重 监控方法 频域滤波算法
3
一种施工任务数据的标准化处理与智能存储架构方法
信息熵 数据嵌入 建筑工程信息化 密度 存储架构系统
4
超高性能混凝土成分对动态抗压强度的影响分析方法
分析方法 超高性能混凝土 学习器 动态 样本
5
一种氧化铝簇团粒子的体散射特性的计算方法及系统
氧化铝粒子 计算方法 散射反照率 特性计算技术 氧化铝颗粒
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号