一种文本隐私脱敏方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510761597

申请日期：2025-06-09

公开号：CN120632935A

公开日期：2025-09-12

类型：发明专利

摘要

本申请属于隐私数据脱敏技术领域，具体公开了一种文本隐私脱敏方法、装置、电子设备及存储介质。该方法包括：将待处理文本转换为对应的词嵌入向量集合；将词嵌入向量集合中的各个词嵌入向量输入至扩散模型，得到扩散模型输出的词嵌入向量集合中各个词嵌入向量对应的预测词嵌入向量；扩散模型是利用锚损失函数和集成模型中的目标隐私攻击分类器进行逆扩散采样训练所得到的；目标隐私攻击分类器是根据文本数据样本及对应的隐私标签训练得到的；将每个预测词嵌入向量转换为对应的词汇并组合，得到待处理文本对应的脱敏文本。通过本申请，可以有效提高生成脱敏文本的可用性，提升文本的隐私保护性能，缓解文本数据隐私保护效果差的问题。

技术关键词

词嵌入向量脱敏方法文本噪声数据样本网络数据脱敏技术标签计算机程序产品数据隐私保护分类器组合处理器脱敏装置电子设备可读存储介质存储计算机程序后验概率存储器

系统为您推荐了相关专利信息

一种电子病历解析方法、系统、设备及介质

电子病历解析方法文本大语言模型生成标签

一种基于灰色预测模型的抑郁预测方法与相关产品

灰色预测模型抑郁灰色系统理论预测误差数据

模型训练方法、装置、存储介质及程序产品

样本时序文本编码器计算机执行指令模型训练方法

一种动态集成选择ICU危重病可解释实时预测方法、装置、存储介质及设备

样本动态异质优化遗传算法变量

一种社交平台帖子热度预测的方法和系统

帖子社交平台交互特征深度学习模型情感特征

一种文本隐私脱敏方法、装置、电子设备及存储介质

站点导航

APP 下载