摘要
本发明提供了一种增强文本匿名性的风格迁移方法,可应用于自然语言处理和隐私保护技术领域。该方法包括:利用预设大语言模型生成提示指令集;对表意相同但属性不相同的多个伪平行语料库进行迭代地匹配和翻译,得到查询文本库和参考文本库;将查询文本库与提示指令集组合后输入到预训练的文本风格改写模型中进行处理,得到生成文本,通过生成文本与参考文本库之间的语义相似度对提示指令集进行筛选,得到筛选后的提示指令集;将筛选后的提示指令集和待处理文本进行组合后输入到预训练的文本风格改写模型中,生成多个输出文本;利用预设风格迁移评价指标对多个输出文本进行匿名有效性的评估和筛选,得到待处理文本匿名性增强与风格迁移后的文本。
技术关键词
平行语料库
翻译模型
文本
风格迁移方法
语义
双向变换器
注意力机制
大语言模型
搜索算法
隐私保护技术
指标
分类器
长短期记忆网络
有效性
下轮
波束
解码器
编码器
自然语言
系统为您推荐了相关专利信息
会话生成方法
策略
计算机可执行指令
历史会话
可读存储介质
优化设计方法
聚类
组合优化方法
标签
动作一体化