一种大模型推理能力优化方法、系统及存储介质

正文

推荐专利

申请号：CN202510413458

申请日期：2025-04-03

公开号：CN119940485A

公开日期：2025-05-06

类型：发明专利

摘要

一种大模型推理能力优化方法、系统及存储介质，其包括S10、初始化待微调的大语言模型，将其作为主模型和对手模型的初始版本；S20、从监督微调数据集中获取提示信息与问题内容，并输入对手模型，生成对应的对手模型响应；S30、利用监督微调数据集中的真实响应，通过第一预设公式最小化逻辑损失函数优化主模型中的权重参数，训练主模型以区分对手模型响应与真实响应；S40、通过第二预设公式最大化主模型对生成响应的评估值，以更新对手模型中的权重参数；第二预设公式中引入正则化项；S50、将训练后的主模型作为新的对手模型，替换当前的对手模型；S60、并重复步骤S20至S50，直至主模型收敛。

技术关键词

能力优化方法损失函数优化模型更新数据分布可读存储介质正则化参数逻辑模块优化器计算机注意力程序依序格式处理器精度

系统为您推荐了相关专利信息

图像真伪确定方法、装置、设备、介质及程序产品

多模态特征统计特征频域特征梯度方向直方图图像生成模型

一种基于ARIMA模型的电容器寿命预测方法及相关设备

ARIMA模型寿命预测方法序列数据噪声

一种基于激光雷达的集装箱定位方法、系统、设备及存储介质

集装箱定位方法装卸平台 RANSAC算法局部特征提取方程

订单处理方法、装置、存储介质及电子设备

订单工作站货箱播种墙机器人

一种植入物跟踪方法、装置、电子设备及存储介质

三维点云数据植入物三维模型示踪器特征点

一种大模型推理能力优化方法、系统及存储介质

站点导航

APP 下载