摘要
本申请公开了一种利用大语言模型的自然语言匿名化方法、装置及存储介质,涉及人工智能技术,包括:获取原始文本数据,并配置提示词;基于所述原始文本数据以及关联的提示词,利用所述LLM提取所述原始文本数据中相关的主体信息和非主体信息;利用所述LLM剔除所述非主体信息中包含的主体信息,以完成所述非主体信息的匿名化;并对所述主体信息进行匿名化处理;基于匿名化后的所述主体信息和所述非主体信息,利用所述LLM,将匿名化后的所述主体信息和所述非主体信息合并为自然语言。本申请提供了一种对文本数据完成脱敏的有效方法,能够最大程度上保留信息和语义。
技术关键词
大语言模型
匿名化方法
自然语言
文本
匿名化装置
数据
格式化
可读存储介质
人工智能技术
处理器
计算机
算法
语义