一种基于大语言模型的跨领域数据匹配方法

正文

推荐专利

一种基于大语言模型的跨领域数据匹配方法

申请号：CN202411433416

申请日期：2024-10-15

公开号：CN119003740B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于大语言模型的跨领域数据匹配方法，包括以下步骤：输入源数据和目标数据，且两者分别来自患者信息和药物数据；分别从源数据和目标数据中提取实体对，所述源数据中的实体对具有标签的，即被标记为匹配或者不匹配，目标数据中的实体对不具有标签；主动候选源数据生成；上下文演示选择；将每个实体对的域信息注入到预定义格式中，将提示发送给大语言模型进行处理，大语言模型根据接收到的提示返回特定实体对的结果。本申请探索了大语言模型执行跨域实体解析的上下文学习能力。本申请提高了大语言模型在跨域实体解析任务中的性能，能选择更有价值的演示并构建更高质量的提示。

技术关键词

大语言模型数据匹配方法实体标签语义向量朴素贝叶斯分类器主动学习方法构建分类器序列度量特征值标记令牌格式计算方法超参数编码器

一种基于大语言模型的跨领域数据匹配方法

站点导航

APP 下载