摘要
本发明公开了一种基于转录组测序基因表达量数据制定生物标志物参考区间的方法,该方法包括下述步骤:构建健康组和患者组的转录组测序基因表达量数据集;筛除健康组和患者组中的低表达基因;基于IQR方法检测并去除健康组和患者组的数据集中的离群样本,并填充离群点;根据健康组和患者组的转录组测序基因表达量数据集中共有的基因名称提取对应基因的counts数值;对基因长度及测序深度进行标准化,将提取的基因的counts数值转换为TPM值;基于SMR算法确定参考区间;确定每个基因的趋势;确定目标生物标志物及对应的参考区间。本发明能很好地匹配转录组测序基因表达量数据的偏态分布特性,划分生物标志物基因表达量的参考区间。
技术关键词
基因
生物标志物
转录组测序数据
患者
离群点
样本
数值
执行存储器存储
算法
输出模块
处理器
计算机设备
可读存储介质
程序
元素
系统为您推荐了相关专利信息
鼻塞流涕
存储服务器
标签模块
数据收集模块
数据处理模块
随机森林
呼气
特征识别系统
超声造影
可读存储介质
信息收集设备
管理方法
信息采集模块
控制模块
关键点