摘要
本发明公开一种基于大语言模型和检索增强生成的无训练生物医学实体链接方法,包括:将待链接的指称输入经生物医学语料库预训练的SAPBERT‑PubMedBERT模型转化为指称嵌入向量;采用降维技术对所述指称嵌入向量进行维度蒸馏;将指称嵌入向量与预先构建的知识数据库中的实体嵌入向量进行相似性计算得到相似性分数并筛选出指定数量的候选项实体构建候选实体项集合;设计包括指令、样本示例和实际输入的提示模板;将所述提示模板中的内容输入大语言模型,以在候选实体项集合选择出待链接指称对应的最优实体项。本发明能够在不同数据集上实现高性能的实体链接,且无需针对不同任务进行重新训练。
技术关键词
大语言模型
降维技术
生物医学实体链接
知识数据库构建
蒸馏
混合索引方法
样本
模板
存储程序代码
编码器模块
可读存储介质
输出模块
指令
存储器
计算机
处理器
高性能
系统为您推荐了相关专利信息
单目深度估计
图像分割模型
三维重建算法
三维模型
注意力
对话策略
模型生成方法
存储模块
识别患者
大语言模型