摘要
本发明涉及大数据技术领域,特别是涉及一种基于贝叶斯网络的医学结构化数据的脱敏方法及其设备。该方法先将医学结构化数据转化为符合规定的离散化数据。再通过评分搜索的近似求解方法和最大似然算法对原始数据集进行结构学习和参数学习,得到包含指标间关联关系及其对应的条件概率分布的贝叶斯网络,最后利用贝叶斯网络生成脱敏数据集。为了验证生成的脱敏数据与原始数据集的相似性,本发明继续利用脱敏数据集构建贝叶斯网络,并对比两个贝叶斯网络在结构和参数上的一致性。本发明还利用PostgreSQL的PL/R扩展将方案在数据库内集成部署,使得脱敏流程无需数据导出即可完成,进而解决现有方案难以兼顾数据脱敏、关联信息保真和安全性等多维度需求的问题。
技术关键词
脱敏数据
脱敏方法
近似求解方法
医学
指标
变量
种子
网络结构优化
网络节点
参数
爬山算法
处理器
大数据技术
计算机程序产品
样本
估计方法