一种文本数据的公平表示学习方法

AITNT
正文
推荐专利
一种文本数据的公平表示学习方法
申请号:CN202410885358
申请日期:2024-07-03
公开号:CN119067166A
公开日期:2024-12-03
类型:发明专利
摘要
本发明提供了一种文本数据的公平表示学习方法。该方法包括:将收集的文本数据转换成词表,利用词表构建由离散向量组成的词表嵌入矩阵;利用BERT将词表嵌入矩阵转化为嵌入表示向量;根据嵌入表示向量度量受保护属性和类簇结构对原始文本数据信息编码的影响,基于非渐进失真度量函数的度量结果设计损失函数,利用损失函数训练深度神经网络,构建公平表征空间模型;将待处理的文本数据清洗后输入到公平表征空间模型,公平表征空间模型输出待处理的文本数据的公平表示。本发明方法确保数据在转换到嵌入空间时能够保持其原始信息的完整性和准确性,提高模型的泛化能力和鲁棒性。能够避免由于数据偏见导致的不公平现象,增强用户对模型的信任和接受度。
技术关键词
训练深度神经网络 受保护 文本 信息编码 深度神经网络模型 度量 矩阵 学习方法 样本 代表 数据标签 数据编码 定义 语义 鲁棒性 编码器 误差
系统为您推荐了相关专利信息
1
筛选条件创建方法、系统、设备、存储介质及程序产品
脚本 字段 客户端 服务端 文本
2
CT图像目标特征的分类方法、装置、电子设备及存储介质
分类网络 分类方法 文本编码器 分支 报告
3
基于多模态异常内容理解的内容主体发现方法
矩阵 关键帧 全局特征提取 局部特征提取 图像编码器
4
能力推荐方法、装置、设备、存储介质及程序产品
三元组 推荐方法 关键词提取模型 文本 编码器
5
基于迭代强化学习的VLA模型优化方法、装置、设备及介质
模型优化方法 解码器 轨迹 机器人 图像特征向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号