摘要
本发明公开了一种基於 PubMed 的医学文本挖掘方法、装置及设备,从 PubMed 数据库中检索目标疾病不同阶段的相关文献,并将文献存储到预设数据库,得到不同阶段的文献集。文本挖掘模型将临床体检指标集作为索引集,在文献集中进行检索,并根据各指标在不同阶段的文献集中出现的频次确定目标疾病各阶段的关联指标集。通过改进 TF-IDF 方法分析对各阶段关联指标集中的指标进行排序,得到目标疾病各阶段的目标关联指标集。本发明基於 PubMed 数据库进行检索,得到疾病不同阶段较为全面的相关的文献,减少了数据源的限制,使数据更加全面。目标关联指标集中各指标与目标疾病相关性较高,医护人员可以参考目标关联指标集进行诊断。
技术关键词
文本挖掘方法
指标
阶段
疾病
医学
索引
数据