摘要
本发明公开了一种基于局部相似性的代谢组学样本归一化方法及系统,方法包括:初始化步骤,给定待归一化的代谢组学数据矩阵并初始化样本的归一化系数;投影步骤,将数据矩阵投影到主成分分析子空间中,得到投影数据矩阵;最近邻集构建步骤,利用数据矩阵计算任意两个样本之间的相关性,并利用投影数据矩阵计算任意两个样本之间的距离,根据相关性和距离指标得到每个样本的最近邻集;样本归一化步骤,计算样本向量的归一化系数,得到归一化组成新的数据矩阵;迭代步骤,迭代子空间投影步骤至样本归一化步骤,直至归一化数据矩阵的相对变化量小于给定阈值。本发明保留了数据的局部结构,同时矫正稀释效应,使样本数据之间具有更好的可比性。
技术关键词
样本
归一化方法
代谢组学数据
矩阵
归一化模块
成分分析
变量
归一化系统
皮尔逊相关系数
投影模块
唾液
指标
算法
患者
矫正
参数
效应
系统为您推荐了相关专利信息
印刷电路板缺陷
金字塔结构
检测印刷电路板
语义
融合特征
数据中心基础设施
自动监控方法
DBSCAN算法
自动监控装置
离群点
大数据平台
性能指标数据
Xgboost算法
网关
随机森林模型
营养监测方法
深度森林模型
Stacking集成学习
学习器
数码