敏感信息识别方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510840024

申请日期：2025-06-23

公开号：CN120337938A

公开日期：2025-07-18

类型：发明专利

摘要

本申请公开了一种敏感信息识别方法、装置、设备、存储介质及程序产品，涉及信息识别技术领域，该方法包括：初筛待检测文本，获得敏感标记文本和未标记文本；基于向量数据库对未标记文本进行检索，获得多个候选敏感数据，并与待检测文本融合获得融合文本；通过大语言模型对融合文本进行语境分析，得到敏感置信数据；根据敏感标记文本和敏感置信数据，生成敏感信息识别报告。由于本申请融合向量数据库进行检索，避免了误报、漏报和误判等情况；并结合具有先进语言理解能力的大语言模型进行分析，得到敏感置信数据，有助于准确识别和处理自然语言中的敏感信息。通过向量数据库和大语言模型的层层识别，提高了敏感信息识别的准确性。

技术关键词

敏感信息识别方法文本标记计算机程序产品信息识别技术报告数据分词大语言模型模型误差训练集处理器语义特征自然语言分析模块可读存储介质模式

系统为您推荐了相关专利信息

一种基于RAG框架的知识库文件上传一致性保障方法及装置

数据框架保障方法大语言模型可读存储介质

基于大模型和微调的虚假信息及评论的自动检测与控制方法及系统

上下文特征图像大语言模型矩阵文本编码器

绝缘层状态评估方法、装置、计算机设备和存储介质

训练特征神经网络模型希尔伯特黄变换集合经验模态分解方法状态评估方法

空调及其控制方法、装置、存储介质和计算机程序产品

空调设备运行数据天气预报数据基础计算机程序产品

基于多种特征输入的看麦娘属植物分类检索方法及系统

分类检索方法植物特征训练集数据非暂态计算机可读存储介质处理器

敏感信息识别方法、装置、设备、存储介质及程序产品

站点导航

APP 下载