摘要
本发明属于数据处理技术领域,本发明公开了基于聚类分析的哨点基因库数据处理方法,包括:提取哨点基因库中样本的基因表达数据,构建静态特征空间和动态时序空间;对静态特征空间进行初步聚类,得到初始静态分组;在各静态分组内切换至动态时序空间,基于时间序列相似性对组内样本执行二次聚类,细化为动态演化亚组;为每个动态演化亚组拟合基因表达随时间变化的动态轨迹模型,在静态特征空间中计算样本与对应动态轨迹模型预测值的偏离度,将偏离度超过预设置信区间的样本标记为异常样本;进一步拓展了哨点基因库在生物医学研究中的应用场景与价值。
技术关键词
轨迹模型
基因表达数据
数据处理方法
静态特征
样本
动态
节点
轨迹特征
时间序列聚类方法
时序
无监督聚类方法
加权无向图
蛋白质修饰
强度
主成分分析法
图谱
蛋白质表达
系统为您推荐了相关专利信息
检索策略
数据检索方法
语义数据库
特征提取网络
异构特征
智能预测方法
天然气
冗余特征
特征选择算法
数据
风险分析方法
预训练语言模型
数据
计算机可读程序
计算机可读指令