摘要
本发明涉及宏基因组测序评估技术领域,具体为一种宏基因组测序数据作为训练数据的算法评估系统,系统包括:数据采集模块,基于临床样本特征和测序片段,进行序列读取,并进行序列长度值比对,筛选菌群丰度参数和病原体来源参数。本发明中,通过序列长度值比对、菌群丰度参数筛选、病原体来源参数记录和碱基质量分数分析,建立采集要素集,在初始阶段即确保数据的完整性和多维度信息关联。通过提取菌群丰度参数和病原体来源参数的中值,结合序列长度值在采集时间戳下的波动监测,对碱基质量分数分布进行比较,自适应调整丰度阈值,使数据在不同样本条件下具备针对性的适配能力。
技术关键词
基因组测序数据
评估系统
序列
子模块
数据采集模块
标记
样本
算法
形态
过滤模块
异常信息
条目
生成参数
分段
异常点
校准
数值