摘要
本申请公开了一种大语言模型逻辑推理方法、装置、设备、存储介质及产品,涉及大语言模型技术领域,所述的方法包括:根据预设问题、逻辑大语言模型生成的中间步骤和推理路径构建逻辑推理树;对逻辑大语言模型和逻辑树评分模型进行交替训练,获得训练后的逻辑大语言模型和训练后的逻辑树评分模型;根据训练后的逻辑树评分模型评估训练后的逻辑大语言模型根据逻辑推理树生成的多个下一步推理路径,获得最佳推理路径。由于本申请通过训练逻辑树评分模型替代现有的提示大模型评分策略,在评分过程中无需预设提示语或高级的大语言大模型,并交替训练逻辑树评分模型和逻辑大模型,从而在面对复杂问题时,提高了模型推理的准确率。
技术关键词
大语言模型
逻辑推理方法
计算机程序产品
指令
处理器
可读存储介质
存储器
数据
节点
模块
参数
策略
系统为您推荐了相关专利信息
缺陷数据集构建
预处理图像数据
表面缺陷图像
融合特征
缺陷类别