摘要
本发明公开了一种基于检索增强验证和改进的复杂推理方法,包括如下步骤:S1、根节点为输入的一个多跳问题,初始化根节点是输出的一个原始问题,即需要解决的问题;S2、开始一次搜索模拟:使用蒙特卡洛树搜索算法,进行搜索模拟;S3、从树中选择一个候选结点进行探索;S4、对选择的候选结点进行子结点的扩展;S5、对于扩展得到的子结点进行奖励计算;S6、奖励回传,更新整个树的结点价值,结束一次模拟;S7、循环上述过程,直到达到最大模拟次数或得到终点结点。本申请通过树搜索算法来全面探索解决空间,将检索到的信息作为外部指导进行验证和修正,融入推理过程,从而避免了知识冲突并提升了推理的深度和准确性,减少模型在多步推理中的错误。
技术关键词
推理方法
节点
结点
生成答案
蒙特卡洛树
搜索算法
UCT算法
策略
终点
孩子
计划
逻辑
编码
风险
参数