摘要
本发明公开了基于大模型的文本关键词脱敏方法、系统、设备及介质,属于大模型及自然语言处理技术领域,本发明要解决的技术问题为如何自动识别并脱敏敏感信息,提高敏感信息识别的准确性,进而提升文本处理效率,采用的技术方案为:数据收集;数据预处理;标注敏感信息;数据分割;基础模型选择;模型微调;训练微调后的大语言模型,获取并保存训练后的微调后的大语言模型;预处理待处理的文本数据;检测敏感信息、制定脱敏策略并实施脱敏处理,对脱敏处理后的文本进行脱敏验证,根据验证结果优化并改进微调后的大语言模型;将优化并改进后的微调后的大语言模型封装成API服务,供应用程序调用。
技术关键词
脱敏方法
大语言模型
脱敏策略
脱敏规则
检测敏感信息
关键词
数据
标注规则
计算机执行指令
标签
爬虫技术
标注工具
敏感信息识别
加密
文本规范化
字符串替换
序列
分词
脚本
系统为您推荐了相关专利信息
文本
定位规则
上下文特征
水印嵌入方法
大语言模型
大语言模型
聊天系统
聊天方法
知识库系统
意图识别
自然语言
大语言模型
管理设备
设备管理方法
意图识别
语义相关度
融合知识图谱
大语言模型
指令
问答方法