摘要
本申请涉及一种代码大模型的训练方法、装置、计算机设备和存储介质。所述方法包括:样本指令数据集中包含多种类型的样本指令数据,各类型之间存在类型重叠,每种类型的样本指令数据基于对应类型的实际代码数据得到,服务器获取上述样本指令数据集,并将其输入待训练的代码大模型中,得到各类型预测代码数据,确定待训练的代码大模型中针对各类型样本指令数据预设的动态参数,并根据各类型预测代码数据和对应类型实际代码数据之间的差异,对对应类型的动态参数进行参数调整,以减少不同类型样本指令数据对应的动态参数的调整干扰,得到训练完成的代码大模型。采用本方法能够减少各类型样本指令数据之间的调整干扰,提高模型的输出效果。
技术关键词
样本
动态
参数
生成指令
数据格式
计算机设备
基准
模型训练模块
训练装置
处理器
输入模块
可读存储介质
存储器
曲线
服务器
关系
算法
系统为您推荐了相关专利信息
建链方法
FPGA芯片
PCIE设备
国产处理器
金手指接口
数据可视化平台
高炉风口回旋区
冷却壁热负荷
粒子系统
渣皮厚度
交通流量预测方法
序列
数据
预测网络模型
解码器
像素
人脸关键点
仿射变换关系
训练分类模型
人脸属性
扬声器控制方法
定向声波
麦克风阵列
控制电路
声学超表面