摘要
本发明公开了一种面向非独立基因数据的联邦分析方法,包括:S1、客户端对用户基因序列数据集进行身份加密与匿名化处理;S2、分别对表型数据和基因型数据进行预处理,并对标准化的基因型数据进行主成分分析;S3、采用回归模型,以根据研究目的确定的特定表型作为因变量,以其他所需特征和前5个主成分作为协变量,以基因位点基因型作为自变量,分别计算每个基因位点对特定表型的遗传效应值;S4、计算对应的样本的标识码列表,以及对照样本比例和病例比例;S5、主服务器采用联邦平均算法,对每个基因位点计算不同遗传效应值的方差矩阵和权重向量并聚合遗传效应值,从而解决了合并多个 GWAS 分析时的数据隐私问题以及样本重叠问题。
技术关键词
分析方法
基因序列数据
效应
位点基因型
客户端
服务器
识别个人身份
生成算法
样本
成分分析
矩阵
加密
列表
分析系统
计算方法
变量
系统为您推荐了相关专利信息
电力设施
台账数据
倾斜摄影相机
GIS平台
校准方法
电磁阀驱动电路
控制信号输入电路
5V电压转换电路
微控制器
贴片二极管
叶片表面缺陷
识别分析方法
长短记忆网络
特征金字塔网络
缺陷轮廓