摘要
本发明公开了一种智能体测评方法、装置、电子设备、存储介质和程序,其中,该方法包括:基于智能体角色确定目标智能体的测试用例集;基于所述测试用例集生成所述目标智能体的测试结果;根据智能体评价模型确定各所述测试结果对应的评价结果。本发明实施例可实现智能体的自动化测评,对智能体测评过程进行量化评价,可提升智能体评价的客观性。
技术关键词
测试用例集
集成学习算法
测评方法
模板
生成智能
报告
数据
计算机程序产品
图表
指标
电子设备
测评装置
可读存储介质
处理器通信
脚本
多模态
模块
存储器