摘要
本申请公开了针对大模型的智能评测方法、设备及介质,涉及大模型领域,方法包括:获取被测模型、裁判模型、对标模型,进行评分定义,进行第一提示词的维护;获取用户基于评分定义的自定义评测信息;根据自定义评测信息,基于预设的评测集中的评测问题,对被测模型、对标模型分别进行提问,分别得到对应的第一输出答案、第二输出答案;通过裁判模型对被测模型进行智能评测。通过裁判模型辅助决策,根据各评测问题进行智能评分,并提供评分依据,生成智能评测结果,辅助人工的决策评分,设置了完整的评测标准,保证了评测过程中的一致性和复杂性降低,同时保证了评测结果的公平性和可靠性。
技术关键词
智能评测方法
答案
计算机可执行指令
智能评测设备
定义
语义
生成智能
处理器通信
机制
参数
决策
模式
存储器
介质
语句
基准
系统为您推荐了相关专利信息
粒子群算法
时间序列预测方法
机器学习算法
温度预测模型
机器学习模型训练
知识检索方法
文本
语音识别算法
知识检索技术
环境噪声抑制
子模块
规则库管理模块
报告
图谱
文档布局分析技术
时间序列预测模型
计算机可执行指令
配电网故障
数据
措施
土壤水分监测设备
EEPROM存储芯片
无线信号发射天线
电源供电模块
锂电池保护模块