代码大模型的训练方法、装置、计算机设备和存储介质

正文

推荐专利

申请号：CN202411058253

申请日期：2024-08-02

公开号：CN119066419A

公开日期：2024-12-03

类型：发明专利

摘要

本申请涉及一种代码大模型的训练方法、装置、计算机设备和存储介质。所述方法包括：样本指令数据集中包含多种类型的样本指令数据，各类型之间存在类型重叠，每种类型的样本指令数据基于对应类型的实际代码数据得到，服务器获取上述样本指令数据集，并将其输入待训练的代码大模型中，得到各类型预测代码数据，确定待训练的代码大模型中针对各类型样本指令数据预设的动态参数，并根据各类型预测代码数据和对应类型实际代码数据之间的差异，对对应类型的动态参数进行参数调整，以减少不同类型样本指令数据对应的动态参数的调整干扰，得到训练完成的代码大模型。采用本方法能够减少各类型样本指令数据之间的调整干扰，提高模型的输出效果。

技术关键词

样本动态参数生成指令数据格式计算机设备基准模型训练模块训练装置处理器输入模块可读存储介质存储器曲线服务器关系算法

系统为您推荐了相关专利信息

基于龙芯3A5000和7A1000芯片组的PCIE外设二次扫描建链方法

建链方法 FPGA芯片 PCIE设备国产处理器金手指接口

一种基于虚幻4引擎开发的高炉数据可视化平台及其开发方法

数据可视化平台高炉风口回旋区冷却壁热负荷粒子系统渣皮厚度

一种融合趋势与季节性的交通流量预测方法

交通流量预测方法序列数据预测网络模型解码器

一种身份认证方法、装置及设备

像素人脸关键点仿射变换关系训练分类模型人脸属性

一种基于MEMS定向声波扬声器控制方法

扬声器控制方法定向声波麦克风阵列控制电路声学超表面

代码大模型的训练方法、装置、计算机设备和存储介质

站点导航

APP 下载