一种大模型后训练方法、装置、计算机程序及存储介质

AITNT
正文
推荐专利
一种大模型后训练方法、装置、计算机程序及存储介质
申请号:CN202510975987
申请日期:2025-07-15
公开号:CN120851117A
公开日期:2025-10-28
类型:发明专利
摘要
本公开涉及一种大模型后训练方法、装置、计算机程序及存储介质,该方法包括:获取大模型对同一请求问题生成的包含多个候选答案的输出组;将所述多个候选答案中的至少一个替换为标准答案,得到更新后的输出组;基于更新后的输出组,对所述大模型进行训练。本公开实施例通过动态替换与单阶段训练的结合,使得模型在无需依赖复杂外部模块或人工干预的情况下,高效优化生成策略。
技术关键词
答案 错误率 非易失性计算机可读存储介质 策略 传播算法 进程 训练装置 处理器 动态 参数 强度 模块 存储器 阶段 电子设备 数据 因子
系统为您推荐了相关专利信息
1
一种增量学习增强的集成代理辅助进化算法
进化算法 船舶 泊位 训练集 动态
2
基于PPO-RNN算法的认知干扰决策方法及干扰端
实时状态信息 干扰决策方法 循环卷积网络 策略 联合损失函数
3
一种基于妥协机制的经验增强型多代理辩论系统及方法
答案 机制 轨迹 大语言模型 模块
4
考虑政策约束的新能源场站现货交易优化决策方法及系统
优化决策方法 新能源场站 加权融合算法 策略 滑动时间窗
5
基于大模型的异构工控网络智能防护方法及系统
安全漏洞挖掘 智能防护方法 异构 终端系统 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号