摘要
本发明属于数据合成技术领域,具体为基于联邦学习与扩散模型的表格数据合成方法。本发明包括采用联邦学习训练跨客户端表格数据扩散合成模型,并使用Transformer架构来捕获数据原始信息及数据跨列相关性信息;数据扩散合成模型包括:数据预处理对齐模块,用于解决不同客户端所持有数据的交集识别及对应数据索引对齐的问题;异端数据潜在向量映射模块,对所有客户端所持有数据训练同一变分自编码器模型,将所有客户端数据映射到同一向量空间中;数据扩散合成模块,利用位置编码和多头自注意力机制等捕获表格数据加噪过程中原始数据信息以及列与列之间的关联性信息。本发明可在各客户端原始数据不出域条件下拟合列的相关性信息及生成近似真实数据的合成数据。
技术关键词
客户端
数据
PSI方法
分支
表格
元素
伪随机函数
特征建模方法
属性匹配
编码
对齐模块
字典
矩阵计算方法
协方差矩阵
联邦学习模型
多头注意力机制
整体吞吐量
系统为您推荐了相关专利信息
意图识别方法
画像特征
LightGBM模型
深度学习框架
客服
氧气发生器
供氧系统
氧气汇流排
智能调控
多模态
自然语言
数据统计分析方法
语句
关键词
计算机可执行指令
大语言模型
立体车库故障
智能立体车库
分析系统
子模块