基于大模型的文本关键词脱敏方法、系统、设备及介质

正文

推荐专利

申请号：CN202411720763

申请日期：2024-11-28

公开号：CN119622809A

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了基于大模型的文本关键词脱敏方法、系统、设备及介质，属于大模型及自然语言处理技术领域，本发明要解决的技术问题为如何自动识别并脱敏敏感信息，提高敏感信息识别的准确性，进而提升文本处理效率，采用的技术方案为：数据收集；数据预处理；标注敏感信息；数据分割；基础模型选择；模型微调；训练微调后的大语言模型，获取并保存训练后的微调后的大语言模型；预处理待处理的文本数据；检测敏感信息、制定脱敏策略并实施脱敏处理，对脱敏处理后的文本进行脱敏验证，根据验证结果优化并改进微调后的大语言模型；将优化并改进后的微调后的大语言模型封装成API服务，供应用程序调用。

技术关键词

脱敏方法大语言模型脱敏策略脱敏规则检测敏感信息关键词数据标注规则计算机执行指令标签爬虫技术标注工具敏感信息识别加密文本规范化字符串替换序列分词脚本

系统为您推荐了相关专利信息

水印嵌入方法、计算机设备和计算机可读存储介质

文本定位规则上下文特征水印嵌入方法大语言模型

基于大语言模型的人物科普教育的聊天方法、系统及聊天机器人

大语言模型聊天系统聊天方法知识库系统意图识别

基于大语言模型的设备管理方法、装置、电子设备和存储介质

自然语言大语言模型管理设备设备管理方法意图识别

一种融合知识图谱和大语言模型的学术问答系统及方法

语义相关度融合知识图谱大语言模型指令问答方法

基于检索增强生成的语音问答方法、系统、介质及产品

大语言模型语音问答方法音频文本生成技术

基于大模型的文本关键词脱敏方法、系统、设备及介质

站点导航

APP 下载