摘要
本申请实施例公开了一种模型训练方法、装置、设备、存储介质及程序产品,该方法包括:根据第一输入数据,通过第一语言模型,确定多种第一推理结果;按照预设判别规则,在多种第一推理结果中确定合理推理结果;基于合理推理结果,训练第一语言模型,以得到第二语言模型;根据第二输入数据,通过第二语言模型,确定多种第二推理结果;确定多种第二推理结果各自对应的评价结果;根据多种第二推理结果各自对应的评价结果,在多种第二推理结果中确定参考推理结果;基于参考推理结果,训练第二语言模型,以得到目标语言模型。该方法使用以低成本获取到的大量训练数据训练LLM,降低了模型训练成本,并提升了所训练的LLM的推理能力。
技术关键词
模型训练方法
判别规则
存储计算机程序
数据
模型训练装置
可读存储介质
计算机程序产品
模块
处理器
计算机设备
存储器
低成本
电子设备
关系
系统为您推荐了相关专利信息
采样检测方法
养殖场动物
仿生微流控芯片
病原微生物风险
导航车
制冷模块
温度检测设备
露点温度
腔体
环境温湿度检测
数据采集处理单元
氢气
样品室
识别方法
人机交互界面
实体
知识图谱嵌入技术
融合专家
知识图谱嵌入方法
校验架构