一种大型语言模型训练方法及系统

AITNT
正文
推荐专利
一种大型语言模型训练方法及系统
申请号:CN202510866732
申请日期:2025-06-26
公开号:CN121029920A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及人工智能技术领域,尤其涉及一种大型语言模型训练方法及系统。本发明设定证明者、建设性批评者、误导性批评者,建设性批评者的任务是在不直接纠正推理步骤的情况下,协助证明者修改错误预测答案。误导性批评者的任务是误导证明者将正确预测答案更改为错误答案,证明者的任务是在面临误导性批评时保持正确预测答案,面临建设性批评时纠正错误预测答案。通过强化学习共同优化证明者模型、建设性批评者模型、误导性批评者模型的模型参数,将训练好的证明者模型作为目标大型语言模型。本发明有效提高了大型语言模型的推理能力,提升了大型语言模型生成答案精度。
技术关键词
语言模型训练方法 样本 模板 构建训练集 语言模型训练系统 生成答案 人工智能技术 纠正错误 数学 模块 算法 参数 数据 文本 精度
系统为您推荐了相关专利信息
1
一种基于维度筛选的隐私且鲁棒的联邦学习方法及系统
联邦学习方法 客户端 更新模型参数 噪声 中心服务器
2
一种水利工程边坡剩余寿命动态预测方法
水利工程边坡 动态预测方法 边坡位移预测 剩余寿命预测模型 支持向量回归机
3
数据生成方法、装置、计算机设备及存储介质
数据生成方法 模板 计算机可读指令 数据生成装置 策略
4
一种光伏电站负荷的预测方法
历史负荷数据 光伏电站 序列 轮廓系数 时序特征
5
基于深度强化学习辅助的医学图像分割方法及系统
医学图像分割方法 深度强化学习 网络 图像编码器 医学图像分割系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号