摘要
本公开涉及一种医疗大模型评估系统,该系统包括:任务识别模块,用于识别输入的任务的目标任务类型和目标任务难度;动态评估模块,用于根据所述目标任务类型和所述目标任务难度,从预设的评估指标库中确定至少一个与所述任务相匹配的目标评估指标;多模型协作模块,用于基于所述目标评估指标,对预设的多个目标医疗大模型处理所述任务的能力进行评估,得到目标评估分数。本公开能够客观、高效地评估医疗大模型的性能。
技术关键词
指标
多模型
评估系统
采样模块
医疗场景
数据
识别模块
基准
语义
对抗性
动态
答案
机制
算法
关系
系统为您推荐了相关专利信息
服务器集群
评估系统
资源优化调度
软件
长短期记忆网络
热源塔热泵
神经网络模型
粒子群算法
模型构建方法
极值