摘要
本发明涉及知识图谱构建技术领域,尤其为孤独症多源异构大数据的知识图谱的构建方法,包括以下步骤:步骤1:通过可插拔数据采集器,分别从电子病历系统、基因数据库、研究文献库及社交媒体多源异构数据源以实时或定时方式获取原始数据;步骤2:对所述原始数据进行清洗、去噪、缺失值补全与去标识化,并基于统一医学语言系统、《精神障碍诊断与统计手册》第五版及人类表型本体医学本体对术语进行标准化映射;步骤3:在上述医学本体基础上,扩展孤独症相关概念子集并进行版本控制,形成专用孤独症本体,本发明中,实现多源实体的高精度融合,从根本上解决了标准化映射难、抽取精度低及融合对齐困难等技术瓶颈。
技术关键词
多源异构大数据
三元组
多源异构数据源
实体
电子病历系统
角色访问控制机制
知识图谱构建技术
翻译模型
编码器
链路预测算法
数据采集器
模式匹配算法
关系
医学
本体扩展
邻域
样本
术语
条件随机场
系统为您推荐了相关专利信息
查询算法
果蝇优化算法
高浓度
图谱
网络安全预警
运维知识图谱
数字孪生模型
设备运维方法
实体关联关系
混合网络模型