摘要
本发明涉及宏基因组序列聚类技术领域,具体为一种基于多模态特征融合的聚类宏基因组序列的方法、系统、设备及存储介质,该聚类方法通过结合狄利克雷过程高斯混合模型和稀疏亲和图模型,在聚类过程中,系统能够根据聚类数量动态调整处理策略(如是否转入稀疏亲和图模型),确保最终聚类结果满足要求(K=1),适应不同规模的宏基因组数据集,实现对宏基因组数据的高效、精准聚类,能够充分发掘宏基因组测序数据的所包含的信息,最大程度上利用测序数据所包含的生物学特征进行有效聚类,并通过分层聚类的方法降低计算复杂度,加速聚类过程。
技术关键词
多模态特征融合
序列
基因组测序数据
数据输出模块
数据输入模块
高斯混合模型
亲和力
数据处理模块
标签传播算法
贝叶斯分类器
频率
聚类技术
种子
处理器
存储器
训练集
核苷酸