摘要
本发明涉及了人工智能及神经网络技术领域,具体涉及了基于多智能体强化学习的问答方法及系统,本方法包括:首先,获取人机交互时采集的环境数据,据此生成推理任务并将其拆分为多个子任务。接着,运用大语言模型、提示学习和编写接口函数,构建与子任务数量对应的独立智能体,这些智能体通过接口函数执行各自设定的子任务。随后,采用强化学习方法将多个智能体构建为多智能体框架。最后,将推理任务输入多智能体框架,利用强化学习训练框架中的智能体,动态更新其参数,直至满足迭代停止条件,从而获得最优推理结果。
技术关键词
多智能体强化学习
问答方法
强化学习方法
独立智能
大语言模型
依赖关系分析
动态更新
框架
策略
过滤模块
神经网络技术
自然语言
参数
数据
问答系统
程序
可读存储介质
文本
系统为您推荐了相关专利信息
大语言模型
自动更新方法
分析工具
焦点
数据结构格式
交互系统
交互方法
指令输入功能
服务器操作系统
大语言模型
决策辅助系统
大语言模型
集成模块
数据库技术
知识图谱构建