摘要
本发明属于人工智能和自然语言处理领域,为解决传统检索增强生成方法的冗余检索且无法多步推理动态规划的问题,提供一种基于蒙特卡洛树搜索的动态检索决策方案确定方法及系统。基于蒙特卡洛树搜索的动态检索决策方案确定方法包括接收初始查询问题并作为推理过程的起点,以触发调用大语言模型操作;调用大语言模型执行子查询生成与动作选择操作,基于蒙特卡洛树搜索迭代探索子查询问题的推理动作,同时考虑大语言模型的自信度评分和诚实度评分来动态筛选推理路径,得到完整推理轨迹集合;基于完整推理轨迹集合为每个子查询问题构建偏好对,优化推理检索策略,以实现大语言模型的自主判断最佳检索时机。其能够减少无效检索及多步推理动态规划。
技术关键词
蒙特卡洛树搜索
大语言模型
决策
动态
轨迹
检索策略
处理器
计算机程序产品
生成方法
自然语言
因子
可读存储介质
规划
存储器
表达式
电子设备
模块
指令
冗余
系统为您推荐了相关专利信息
备用电池
模糊逻辑控制器
智能调度算法
电力分配
医疗设备
低能见度环境
公路
管控方法
图像
BP神经网络算法
重构方法
信号
噪声特征
融合注意力机制
评估预测模型
决策树模型
识别方法
资金
决策树算法
金融交易平台