摘要
一种基于深度学习的代谢组学数据批次效应校正方法,包括批次内校正和批次间校正两个阶段。批次内校正阶段,采用SERRF方法对QC样本的进样顺序建模,识别并校正系统性漂移效应,消除同一批次内因进样顺序等因素带来的数据偏差。批次间校正阶段,首先计算各批次质心,基于各批次之间的距离确定两两校正顺序;基于生成对抗网络与自编码器的联合框架,通过对抗训练减少批次间系统性偏差,同时引入相互最近邻对齐损失,避免过度校正导致的生物学信息丢失。本发明的多批次数据成对校正顺序的批次校正方法,结合随机森林与深度对抗对齐网络的优势,构建了一个两阶段的联合校正框架。在保留生物样本真实代谢差异的同时,消除数据中的误差,为代谢组学研究提供可靠的数据支持。
技术关键词
样本
代谢组学数据
系统误差
校正方法
随机森林模型
效应
解码器
损失函数优化
编码器训练
生成对抗网络
数据校正
重构
数据压缩
两阶段
定义
系统为您推荐了相关专利信息
需求预测模型
中央厨房
管理方法
云端
调度请求信息
MEMS传感器阵列
分类系统
功率放大模块
微控制器
电压跟随器
时间段
历史运行数据
时序预测模型
异常数据
监控方法
连续手语识别方法
多模态信息
三次样条插值
识别模型训练
数据