摘要
一种大模型推理能力优化方法、系统及存储介质,其包括S10、初始化待微调的大语言模型,将其作为主模型和对手模型的初始版本;S20、从监督微调数据集中获取提示信息与问题内容,并输入对手模型,生成对应的对手模型响应;S30、利用监督微调数据集中的真实响应,通过第一预设公式最小化逻辑损失函数优化主模型中的权重参数,训练主模型以区分对手模型响应与真实响应;S40、通过第二预设公式最大化主模型对生成响应的评估值,以更新对手模型中的权重参数;第二预设公式中引入正则化项;S50、将训练后的主模型作为新的对手模型,替换当前的对手模型;S60、并重复步骤S20至S50,直至主模型收敛。
技术关键词
能力优化方法
损失函数优化
模型更新
数据分布
可读存储介质
正则化参数
逻辑
模块
优化器
计算机
注意力
程序
依序
格式
处理器
精度
系统为您推荐了相关专利信息
多模态特征
统计特征
频域特征
梯度方向直方图
图像生成模型
集装箱定位方法
装卸平台
RANSAC算法
局部特征提取
方程