摘要
本发明涉及医疗数据管理领域,具体提供一种医疗文本隐私信息抽取及加密方法、系统、终端及介质,包括:使用自然语言处理技术从医疗文本中提取实体;将医疗文本和提取的实体输入预先训练的基于神经网络的关系抽取模型,获取各个实体之间的关系,生成实体关系三元组;根据敏感库和关联规则初步筛选出隐私候选集,利用隐私识别模型对候选集进行语义验证实现二次筛选,获得最终的隐私候选集;根据最终的隐私候选集中的实体,使用差分隐私技术对医疗文本中的对应实体添加噪声,生成噪声扰动的医疗文本;将最终的隐私候选集中的三元组进行同态加密后保存。本发明提升隐私识别准确率,降低误报率。
技术关键词
文本
三元组
加密方法
差分隐私技术
关系抽取模型
生成噪声
自然语言
差分隐私保护
敏感关键词
命名实体识别模型
加密密钥管理
神经网络模型
医疗数据管理
序列标注模型
语义
识别置信度
系统为您推荐了相关专利信息
资源特征
资源推荐模型
样本
偏好特征
特征提取模块
数据
系统构建方法
索引
计算机视觉算法
信息提取技术
联合损失函数
解码模块
分析系统
语义标签
子模块
大语言模型
生成方法
知识图谱数据
节点
计算机可执行指令