摘要
本发明提出不完整多组学癌症亚型数据聚类方法,属于机器学习领域,包括:利用变分自编码器为每个样本生成共享潜在表示和组学特定潜在表示,捕捉组学特定的生物学特征,并通过重构损失和KL散度正则化表示分布;采用扩散模型框架融合多组学的共享潜在表示和组学特定潜在表示,生成综合表示,有效处理不完整数据并增强多组学信息的综合提取;通过双级对比学习优化综合表示并增强表示的一致性;通过联合优化聚类损失、重构损失和语义对比损失联合优化聚类输入以生成高质量的潜在表示,基于联合优化后的聚类输入,使用改进的K‑means聚类算法对多组学数据进行分析,得到最终的癌症亚型聚类结果。本发明能够提高癌症亚型识别的准确性和鲁棒性。
技术关键词
数据聚类方法
样本
语义
重构
交叉注意力机制
多层感知机
解码器
参数
矩阵
编码器框架
迭代优化算法
噪声
特征提取方法
索引
数据分布
融合特征
系统为您推荐了相关专利信息
物体定位方法
视角
交叉注意力机制
融合特征
信息传递模块
交通流预测模型
交通流预测方法
节点特征
注意力机制
编码向量
系统优化方法
联邦学习系统
遗传算法
客户端
分类准确率
语音识别转化方法
非瞬时性计算机可读存储介质
文本
数据
音频