摘要
本发明公开了一种大模型评测方法、系统、介质与设备,涉及大模型测试领域,包括:获取动态评测文本数据集;对动态评测文本数据集进行文生图,得到动态评测图片集;对动态评测图片集进行数据质量管控,得到中间动态评测图片集;为中间动态评测图片集中的图片生成问题选项,得到动态评测数据集。本发明保证了性别公平性得分的真实可靠。本发明保证了构建出的动态评测数据集的高质量和随机性,有效避免了待评测的大模型根据静态评测数据集进行针对性训练或者由于数据与模型的随机性导致的评测结果的不稳定。
技术关键词
模型评测方法
动态
职业
数据
文本
图片
副本
评测系统
男性
女性
列表
处理器
可读存储介质
存储器
电子设备
模块
程序
计算机
系统为您推荐了相关专利信息
电磁式振动台
MEMS陀螺仪
导向系统
激光位移传感器
复位控制模块
干涉仪误差
校准方法
视觉检测系统
误差参数
反射镜面型
交互式教学方法
策略
训练人工智能模型
交互式教学装置
人工智能算法
节点
知识图谱构建系统
知识图谱构建方法
车辆
计算机程序指令
智能分析控制系统
输电系统
多层感知机
电力
模型误差