摘要
本发明涉及人工智能技术领域,具体涉及一种基于全局搜索结合外部信息的智能推理方法及系统,其中,一种基于全局搜索结合外部信息的智能推理方法包括以下步骤:S1:利用预训练的大语言模型在当前状态下生成候选动作,同步输出局部生成概率,根据当前状态检索外部支持数据,计算候选动作的外部支持补偿权重;S2:通过候选动作的局部生成概率和外部支持补偿权重计算候选动作的即时收益;S3:通过上限置信区间算法计算候选动作的综合选择值;S4:输出全局最优推理链。本发明能够实现局部生成与全局搜索的深度融合,在候选动作评估和外部信息动态整合方面具有显著改进,极大地提高了多步推理任务的准确性、连贯性和系统鲁棒性。
技术关键词
智能推理方法
蒙特卡洛树搜索
上限置信区间算法
大语言模型
信息模块
智能推理系统
动态
多头注意力机制
关键词
语义需求
数据
语言模块
人工智能技术
编码器
鲁棒性
指标
非线性