摘要
本公开提供了一种通过细粒度分类建模提升大语言模型代理评测准确度的方法,可以应用于人工智能技术领域。该通过细粒度分类建模提升大语言模型代理评测准确度的方法包括:将目标指令输入至大语言模型中,得到模型执行结果以及工具调取结果,其中,工具调取结果表征在大语言模型运行过程中调用工具的能力;确定模型参考结果和工具参考结果,其中,模型参考结果和工具参考结果均为按照与目标指令相匹配的方式确定的;基于模型执行结果和模型参考结果,确定任务完成评估结果;基于工具调取结果和工具参考结果,确定工具调用评估结果。本公开还提供了一种通过细粒度分类建模提升大语言模型代理评测准确度的装置。
技术关键词
细粒度分类
大语言模型
指令
人工智能技术
数据
模块
模版
关系
系统为您推荐了相关专利信息
监测无人机
生态
无人机协同
数据传输方法
监测数据传输系统
网站识别方法
通讯网络
特征提取模块
数据
矩阵分解方法
光伏发电系统动态
点追踪方法
光伏组件
功率
电压
网络营销平台
商品管理系统
多源信息融合
LSTM神经网络
标签模块