一种基于预训练模型和混合模型架构的敏感信息处理方法及系统

正文

推荐专利

申请号：CN202510238647

申请日期：2025-02-28

公开号：CN120162835A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于预训练模型和混合模型架构的敏感信息处理方法及系统，涉及数据安全与隐私保护技术领域。包括：S1.数据集构建；S2.数据集预处理；S3.数据划分；S4.模型构建和训练；S5.定位敏感信息；S6.遗忘敏感信息。本发明在模型性能上，非结构化敏感信息文本识别模型采用词汇级别和字符级别标记化处理及特征增强，显著增强了对敏感信息的识别能力，同时提高了模型对不同非结构化文本的适应性；在数据安全与隐私保护层面，基于梯度信息关键区域分析确定文本中的敏感实体擦除区域，实现敏感信息的精确遗忘，避免过度遗忘，保障数据安全合规。

技术关键词

敏感信息处理方法文本识别模型预训练模型实体信息模块非结构化文本解码器隐私保护技术保障数据安全输入端信息处理系统序列模板处理单元训练集标签

系统为您推荐了相关专利信息

基于文档标注和标签化技术的核电在役检查报告生成方法

检查报告生成方法计算机可读指令标签分词检验方法

基于视觉检测的缝隙检测方法、装置、设备及存储介质

预训练模型特征金字塔缝隙检测装置待测物体上采样

一种面向异构数据理解的跨模态关联识别系统

面向异构数据识别系统跨模态数据获取模块上下文感知解析

一种基于数据分析的就业匹配方法、设备及介质

语义知识图谱动态滑动时间窗口工业生成用户推理算法

轨道交通领域的RAG数据解析方法、装置、设备、介质

表格数据解析方法格式坐标元素

一种基于预训练模型和混合模型架构的敏感信息处理方法及系统

站点导航

APP 下载