摘要
本发明公开一种基于违规溯源路径评分的文档合规性判定方法,涉及数据合规审查技术领域,包括:对待检测文档进行结构化解析,将文档内容拆分为语义单元,并识别其中包含的敏感信息实体;构建从敏感信息实体到法规条款的违规溯源路径;对违规溯源路径进行评分计算,基于路径中各节点和边的属性,确定路径的违规风险等级;基于路径评分结果,匹配对应的法规条款内容,从法规知识图谱中提取法规条款的原文内容、条款编号、适用条件、法域分类信息以及处罚建议,并生成具有可解释性的因果链描述;输出违规结果报告。本发明解决了现有文档审查技术中存在的合规依据不可追溯、违规判定不透明、风险分级缺乏解释支撑等问题。
技术关键词
判定方法
合规性
报告
路径结构
版面分析技术
半结构化文档
识别敏感信息
业务流程系统
图谱
节点
风险
实体识别模型
版面结构
模糊语义
分段算法
审计系统
文本识别