一种文本数据的公平表示学习方法

正文

推荐专利

一种文本数据的公平表示学习方法

申请号：CN202410885358

申请日期：2024-07-03

公开号：CN119067166A

公开日期：2024-12-03

类型：发明专利

摘要

本发明提供了一种文本数据的公平表示学习方法。该方法包括：将收集的文本数据转换成词表，利用词表构建由离散向量组成的词表嵌入矩阵；利用BERT将词表嵌入矩阵转化为嵌入表示向量；根据嵌入表示向量度量受保护属性和类簇结构对原始文本数据信息编码的影响，基于非渐进失真度量函数的度量结果设计损失函数，利用损失函数训练深度神经网络，构建公平表征空间模型；将待处理的文本数据清洗后输入到公平表征空间模型，公平表征空间模型输出待处理的文本数据的公平表示。本发明方法确保数据在转换到嵌入空间时能够保持其原始信息的完整性和准确性，提高模型的泛化能力和鲁棒性。能够避免由于数据偏见导致的不公平现象，增强用户对模型的信任和接受度。

技术关键词

训练深度神经网络受保护文本信息编码深度神经网络模型度量矩阵学习方法样本代表数据标签数据编码定义语义鲁棒性编码器误差

系统为您推荐了相关专利信息

筛选条件创建方法、系统、设备、存储介质及程序产品

脚本字段客户端服务端文本

CT图像目标特征的分类方法、装置、电子设备及存储介质

分类网络分类方法文本编码器分支报告

基于多模态异常内容理解的内容主体发现方法

矩阵关键帧全局特征提取局部特征提取图像编码器

能力推荐方法、装置、设备、存储介质及程序产品

三元组推荐方法关键词提取模型文本编码器

基于迭代强化学习的VLA模型优化方法、装置、设备及介质

模型优化方法解码器轨迹机器人图像特征向量

一种文本数据的公平表示学习方法

站点导航

APP 下载