基于多轮对话的智能体评测方法、装置、电子设备及介质

正文

推荐专利

申请号：CN202411880274

申请日期：2024-12-19

公开号：CN119829964A

公开日期：2025-04-15

类型：发明专利

摘要

本发明提供一种基于多轮对话的智能体评测方法、装置、电子设备及介质，其中的方法包括：构建仅包含输入样本‑输出样本对的评测样本集；基于对抗智能体，根据评测样本集中的输入样本，模拟用户对待评测智能体进行提问；基于裁判智能体，根据提问问题和对应的提问结果，以及输入样本对应的输出样本，确定当前轮对话的反馈结果；根据当前对话轮次及对应的反馈结果，确定待评测智能体的评测结果。该方法通过引入对抗智能体模拟用户对待评测智能体进行提问，同时引入裁判智能体判定待评测智能体在每一轮对话中回答问题的合理性和准确性，解决了现有智能体评测方法构建评测数据集耗时耗力，且无法有效模拟中间交互过程的问题，实现了智能体在理解能力、连贯性、回复质量等方面的全面评估，为智能对话系统的优化提供了有力支持。

技术关键词

评测方法多轮对话样本智能对话系统电子设备处理器评测装置计算机程序产品语义模块存储器介质数据

系统为您推荐了相关专利信息

图像识别方法、装置、电子设备及存储介质

控件图像识别方法生成标识 AI算法圈选事件

芯片封装结构和电子设备

芯片封装结构电连接结构线路板冷却流道支撑件

一种暗黑场景的目标检测方法、装置、设备及介质

图像增强模块训练样本图像边缘密度特征场景非瞬时性计算机可读存储介质

一种数据加密方法、电子设备及介质

加密数据熵源数据加密方法历史访问信息加密算法

材料粒度测量方法、装置、设备及存储介质

分块边界特征粒度测量方法图像识别模型索引

基于多轮对话的智能体评测方法、装置、电子设备及介质

站点导航

APP 下载