基于联邦学习与扩散模型的表格数据合成方法

正文

推荐专利

申请号：CN202510679051

申请日期：2025-05-26

公开号：CN120561966A

公开日期：2025-08-29

类型：发明专利

摘要

本发明属于数据合成技术领域，具体为基于联邦学习与扩散模型的表格数据合成方法。本发明包括采用联邦学习训练跨客户端表格数据扩散合成模型，并使用Transformer架构来捕获数据原始信息及数据跨列相关性信息；数据扩散合成模型包括：数据预处理对齐模块，用于解决不同客户端所持有数据的交集识别及对应数据索引对齐的问题；异端数据潜在向量映射模块，对所有客户端所持有数据训练同一变分自编码器模型，将所有客户端数据映射到同一向量空间中；数据扩散合成模块，利用位置编码和多头自注意力机制等捕获表格数据加噪过程中原始数据信息以及列与列之间的关联性信息。本发明可在各客户端原始数据不出域条件下拟合列的相关性信息及生成近似真实数据的合成数据。

技术关键词

客户端数据 PSI方法分支表格元素伪随机函数特征建模方法属性匹配编码对齐模块字典矩阵计算方法协方差矩阵联邦学习模型多头注意力机制整体吞吐量

系统为您推荐了相关专利信息

基于大小模型融合的用户意图识别方法、装置与电子设备

意图识别方法画像特征 LightGBM模型深度学习框架客服

一种基于多模态感知与智能调控的模块化封闭空间供氧系统设计方法与装置

氧气发生器供氧系统氧气汇流排智能调控多模态

一种智能问答的数据统计分析方法、设备及介质

自然语言数据统计分析方法语句关键词计算机可执行指令

一种密码强度实时评估方法及装置

朴素贝叶斯模型语义特征多项式字符强度

一种基于大语言模型的立体车库故障分析系统及方法

大语言模型立体车库故障智能立体车库分析系统子模块

基于联邦学习与扩散模型的表格数据合成方法

站点导航

APP 下载