一种大型语言模型训练方法及系统

正文

推荐专利

一种大型语言模型训练方法及系统

申请号：CN202510866732

申请日期：2025-06-26

公开号：CN121029920A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及人工智能技术领域，尤其涉及一种大型语言模型训练方法及系统。本发明设定证明者、建设性批评者、误导性批评者，建设性批评者的任务是在不直接纠正推理步骤的情况下，协助证明者修改错误预测答案。误导性批评者的任务是误导证明者将正确预测答案更改为错误答案，证明者的任务是在面临误导性批评时保持正确预测答案，面临建设性批评时纠正错误预测答案。通过强化学习共同优化证明者模型、建设性批评者模型、误导性批评者模型的模型参数，将训练好的证明者模型作为目标大型语言模型。本发明有效提高了大型语言模型的推理能力，提升了大型语言模型生成答案精度。

技术关键词

语言模型训练方法样本模板构建训练集语言模型训练系统生成答案人工智能技术纠正错误数学模块算法参数数据文本精度

系统为您推荐了相关专利信息

一种基于维度筛选的隐私且鲁棒的联邦学习方法及系统

联邦学习方法客户端更新模型参数噪声中心服务器

一种水利工程边坡剩余寿命动态预测方法

水利工程边坡动态预测方法边坡位移预测剩余寿命预测模型支持向量回归机

数据生成方法、装置、计算机设备及存储介质

数据生成方法模板计算机可读指令数据生成装置策略

一种光伏电站负荷的预测方法

历史负荷数据光伏电站序列轮廓系数时序特征

基于深度强化学习辅助的医学图像分割方法及系统

医学图像分割方法深度强化学习网络图像编码器医学图像分割系统

一种大型语言模型训练方法及系统

站点导航

APP 下载