摘要
本申请属于隐私数据脱敏技术领域,具体公开了一种文本隐私脱敏方法、装置、电子设备及存储介质。该方法包括:将待处理文本转换为对应的词嵌入向量集合;将词嵌入向量集合中的各个词嵌入向量输入至扩散模型,得到扩散模型输出的词嵌入向量集合中各个词嵌入向量对应的预测词嵌入向量;扩散模型是利用锚损失函数和集成模型中的目标隐私攻击分类器进行逆扩散采样训练所得到的;目标隐私攻击分类器是根据文本数据样本及对应的隐私标签训练得到的;将每个预测词嵌入向量转换为对应的词汇并组合,得到待处理文本对应的脱敏文本。通过本申请,可以有效提高生成脱敏文本的可用性,提升文本的隐私保护性能,缓解文本数据隐私保护效果差的问题。
技术关键词
词嵌入向量
脱敏方法
文本
噪声数据
样本
网络
数据脱敏技术
标签
计算机程序产品
数据隐私保护
分类器组合
处理器
脱敏装置
电子设备
可读存储介质
存储计算机程序
后验概率
存储器
系统为您推荐了相关专利信息
样本
时序
文本编码器
计算机执行指令
模型训练方法