摘要
本发明涉及自然语言处理技术领域,公开了一种大语言模型临床诊断能力细粒度评估方法及系统。方法包括:获取包患者病历数据集;同步执行以下任务:基于预定评分维度对问题‑标准答案‑模型回答三元组进行评分,计算被评估模型的医学知识得分;被评估模型执行召回任务和鉴别任务,对鉴别诊断列表进行确认或排除,得到最终主诊断;将患者病历中的和被评估模型输出的鉴别诊断列表和最终主诊断以进行链接;基于链接结果分析影响被评估模型临床诊断能力的因素。本发明旨在基于相同的临床诊断情境,深入且同步地评估大语言模型的医学知识与推理能力。
技术关键词
大语言模型
病历
三元组
列表
患者
评估系统
疾病
术语
条目
医学
变量
编码器
定义
答案
自然语言
字段
分析模块
场景
数据
系统为您推荐了相关专利信息
音乐教育方法
学习特征数据
数据存储
资源分配
计算中心
车内结构
血液净化治疗
布局方法
高清视频通信
可移动货架
多模态语音
自动语音识别
大语言模型
文本
计算机可执行程序