摘要
本公开属于智能体系统评测领域,本公开提供了一种基于多智能体协作的大模型应用的评估方法及装置。所述方法包括:根据原始问题,得到所述大模型应用的推理链;对应于所述推理链中的每一步骤,分别调用对应的智能体从所述大模型应用获取一推理数据;分别根据所述推理数据对应的标注数据,对所述推理数据进行评估,得到所述推理链中的对应的步骤的评估结果;根据所述推理链中的每一步骤的评估结果,得到所述大模型应用的评估结果。
技术关键词
多智能体协作
生成智能
预取机制
大语言模型
意图识别
智能体系统
可读存储介质
数据获取模块
模板
处理器
评估装置
存储器
指令
数据存储
实体
电子设备
参数
系统为您推荐了相关专利信息
人工智能教育
青少年
终端设备
教学操作系统
学生
生成可视化界面
生成业务
文档编辑工具
前端组件
代码编辑器
大语言模型
多智能体协同
决策方法
全局状态信息
记忆
自然语言
大语言模型
道路位置信息
道路路况信息
场景
摘要生成方法
代码特征
生成自然语言
预训练模型
编码器