基于大模型的文本关键词脱敏方法、系统、设备及介质

AITNT
正文
推荐专利
基于大模型的文本关键词脱敏方法、系统、设备及介质
申请号:CN202411720763
申请日期:2024-11-28
公开号:CN119622809A
公开日期:2025-03-14
类型:发明专利
摘要
本发明公开了基于大模型的文本关键词脱敏方法、系统、设备及介质,属于大模型及自然语言处理技术领域,本发明要解决的技术问题为如何自动识别并脱敏敏感信息,提高敏感信息识别的准确性,进而提升文本处理效率,采用的技术方案为:数据收集;数据预处理;标注敏感信息;数据分割;基础模型选择;模型微调;训练微调后的大语言模型,获取并保存训练后的微调后的大语言模型;预处理待处理的文本数据;检测敏感信息、制定脱敏策略并实施脱敏处理,对脱敏处理后的文本进行脱敏验证,根据验证结果优化并改进微调后的大语言模型;将优化并改进后的微调后的大语言模型封装成API服务,供应用程序调用。
技术关键词
脱敏方法 大语言模型 脱敏策略 脱敏规则 检测敏感信息 关键词 数据 标注规则 计算机执行指令 标签 爬虫技术 标注工具 敏感信息识别 加密 文本规范化 字符串替换 序列 分词 脚本
系统为您推荐了相关专利信息
1
水印嵌入方法、计算机设备和计算机可读存储介质
文本 定位规则 上下文特征 水印嵌入方法 大语言模型
2
基于大语言模型的人物科普教育的聊天方法、系统及聊天机器人
大语言模型 聊天系统 聊天方法 知识库系统 意图识别
3
基于大语言模型的设备管理方法、装置、电子设备和存储介质
自然语言 大语言模型 管理设备 设备管理方法 意图识别
4
一种融合知识图谱和大语言模型的学术问答系统及方法
语义相关度 融合知识图谱 大语言模型 指令 问答方法
5
基于检索增强生成的语音问答方法、系统、介质及产品
大语言模型 语音问答方法 音频 文本 生成技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号