摘要
本申请提供了合并大规模药物数据列表方法、装置、设备和介质,通过根据最新的UMLS数据集筛选出符合药物概念语义类型的数据,并根据最新的MESH数据集,解析其中药物入口词与其同义词;在MESH数据集中通过药物的实体名称查询所有相同概念编号的药物名称以及同义词名称,并将合并的查询结果作为该药物的同义词集合,据以遍历所有药物的同义词集合;对任意至少两个具有相同元素的同义词集合并,以作为一个新药物的同义词集合;为每个药物定义药物编号,以表征该集合的标准化药物名称。本申请特别是当存在大量重复元素时,以显著提高合并过程的速度。
技术关键词
同义词
列表
概念
元素
数据
新药物
名词术语
复杂度
实体
语义
定义
算法模块
指令
计算机设备
节点
入口
可读存储介质
存储器