摘要
本发明公开了一种基于自动化标签生成与多维度评估的智能体入网评测方法及系统,通过利用大型语言模型自动生成智能体多维度标签并构建智能体画像,结合自动化测试用例生成与多维度评估指标采集,解决了现有技术中智能体评测标准化缺失、评估效率低和“黑箱”诊断困难的问题,实现了对接入平台的多类异构智能体进行标准化、自动化的质量评估,并生成可用于精准检索和调度的智能体画像。该方法和系统可广泛应用于多智能体协同平台、智能体商店及企业级智能体管理系统等场景,具有显著提升智能体生态质量、大幅降低人工评测成本、加速新智能体引入与商业化落地等显著优势。
技术关键词
评测方法
标签
画像
执行测试用例
指标
评分算法
自动化测试用例
深度语义分析
体管理系统
报告
测试执行器
目录
平台
模块
微调技术
评测系统
生成智能
生成场景
定位故障
数据