摘要
本申请涉及人工智能技术领域,具体提供一种大模型生成内容的自动化评测方法、电子设备及存储介质,旨在解决大模型生成内容评测成本较高且效率低下,难以应用在大规模场景的问题。为此目的,本申请根据评测需求信息自动生成多个测试问题,基于多个预设指标从中选取目标测试问题,根据该目标测试问题对应的大模型生成内容得到评测数据,重复上述步骤,根据所有的评测数据以及预设评测指标生成评测结果。本申请无需专业人员参与测评,实现了自动、高效地对大模型生成内容进行评测的目的,不仅适用于大规模评测场景,还实现了提升大模型生产和迭代效率的目的。
技术关键词
评测方法
指标
电子设备
人工智能技术
处理器通信
数据
标签
主题
可读存储介质
存储器
场景
专业
基准
计算机
系统为您推荐了相关专利信息
故障诊断方法
故障诊断模型
金枪鱼群
核主成分分析
低通滤波器
道路环境信息
风险预测模型
车辆状态信息
预警方法
车辆电池
神经网络模型
振动传感器
数据
时域特征
故障诊断方法
智能光伏电池
健康度评估方法
健康状态预测
光伏电池功能
动态