摘要
本发明公开了基于自然语言的数据防泄漏处理系统,包括:信息定义模块、数据匹配模块和分析模块;涉及数据脱敏技术领域,解决了每次识别新的数据文件都需要增加或修改策略内容,导致对保密人员的技术要求较高,而且需要处理的工作量较大技术问题;在对数据文件进行分割成若干个多联文本,并通过大语言模型对分割的内容提取摘要,并将多个摘要中不重要的摘要剔除,再以大语言模型对保留下来的重点摘要进行总结,确定筛选主题;根据大语言模型对筛选主题确定筛选的整合内容,再根据整合内容对数据文件中的呢绒进行匹配、标记,以实现自动对数据文件中的敏感内容进行识别,无需工作人员对数据文件进行详细了解,一定程度的降低了保密人员的工作量。
技术关键词
数据防泄漏
自然语言
大语言模型
摘要
主题
标记
文本
识别数据文件
匹配模块
数据脱敏技术
分析模块
曲线
工作量
分词
定义
符号
介质
数值
系统为您推荐了相关专利信息
场景特征
植物特征
养护装置
大语言模型
计算机可执行指令
广告主
自然语言解析
服务器
机器学习模型
广告投放优化方法