摘要
本发明提供一种基于多轮对话的智能体评测方法、装置、电子设备及介质,其中的方法包括:构建仅包含输入样本‑输出样本对的评测样本集;基于对抗智能体,根据评测样本集中的输入样本,模拟用户对待评测智能体进行提问;基于裁判智能体,根据提问问题和对应的提问结果,以及输入样本对应的输出样本,确定当前轮对话的反馈结果;根据当前对话轮次及对应的反馈结果,确定待评测智能体的评测结果。该方法通过引入对抗智能体模拟用户对待评测智能体进行提问,同时引入裁判智能体判定待评测智能体在每一轮对话中回答问题的合理性和准确性,解决了现有智能体评测方法构建评测数据集耗时耗力,且无法有效模拟中间交互过程的问题,实现了智能体在理解能力、连贯性、回复质量等方面的全面评估,为智能对话系统的优化提供了有力支持。
技术关键词
评测方法
多轮对话
样本
智能对话系统
电子设备
处理器
评测装置
计算机程序产品
语义
模块
存储器
介质
数据
系统为您推荐了相关专利信息
芯片封装结构
电连接结构
线路板
冷却流道
支撑件
图像增强模块
训练样本图像
边缘密度特征
场景
非瞬时性计算机可读存储介质
加密数据
熵源
数据加密方法
历史访问信息
加密算法