一种大型语言模型训练方法、装置、设备及存储介质

AITNT
正文
推荐专利
一种大型语言模型训练方法、装置、设备及存储介质
申请号:CN202510242020
申请日期:2025-03-03
公开号:CN120258104A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种大型语言模型训练方法、装置、设备及存储介质,通过获取待训练的语料数据训练集,从语料数据训练集中的选择语料数据;利用大型语言模型对语料数据进行预测,得到预测结果,基于预测结果,使用交叉熵损失函数进行计算得到损失值,将所述当前损失值进行保存,并根据保存的当前损失值计算得到当前预设损失值,判断损失值是否小于当前预设损失值,若小于,则不更新模型参数,若大于,则根据损失值更新大型语言模型的模型参数和当前预设损失值后,重新从语料数据训练集中的选择语料数据对大型语言模型的模型参数继续进行更新,直到得到训练好的大型语言模型。通过上述方法计算损失值提高语料数据质量,从而提高了大型语言模型性能。
技术关键词
语言模型训练方法 模型训练装置 数据 训练集 更新模型参数 存储计算机程序 计算机设备 模块 处理器 存储器
系统为您推荐了相关专利信息
1
智能化的电动汽车和空调的协调管理方法、平台及系统
历史运行数据 分布式管理系统 调度优化系统 数据预测模型 时序特征
2
一种超前地质预报与处理方法
超前地质预报 实时图像 训练场景 卷积神经网络模型 掌子面
3
车辆维修方案预测方法、装置、计算机设备及存储介质
历史维修数据 训练集 标签 计算机可读指令 图像
4
电网领域关键词抽取方法、训练方法、介质和设备
预训练语言模型 预训练模型 标签预测值 文本 关键词抽取方法
5
一种高比例新能源并网下新能源短期智能优化调度方法
智能优化调度方法 高比例新能源 新能源并网调度 新能源出力预测 分布式协同
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号