融合语义特征的单宏基因组重叠群序列聚类方法及系统

AITNT
正文
推荐专利
融合语义特征的单宏基因组重叠群序列聚类方法及系统
申请号:CN202510100996
申请日期:2025-01-22
公开号:CN119513634A
公开日期:2025-02-25
类型:发明专利
摘要
本发明公开了融合语义特征的单宏基因组重叠群序列聚类方法及系统,所述方法包括:对宏基因组原始数据进行预处理,得到DNA重叠群序列,从重叠群中提取出4‑mer特征,对4‑mer特征进行降维,得到DNA重叠群序列的组成特征;从DNA重叠群序列中选取出训练序列,使用训练序列对DNABERT_S模型进一步预训练后进行语义特征提取,得到语义特征;将组成特征和语义特征输入到预先构建的VAE变分自编码器中进行特征融合重构,并计算重构误差;当重构误差稳定或达到预定的训练轮次时,获取VAE变分自编码器的潜在空间特征,根据潜在空间特征,通过k均值聚类算法完成对DNA重叠群序列的聚类。本发明解决了在缺乏覆盖率特征时聚类精度较低的问题,提高了单样本宏基因组的聚类效果。
技术关键词
序列聚类方法 融合语义 k均值聚类算法 重构误差 语义特征提取 编码器 滑动窗口技术 聚类系统 标记基因 可读存储介质 组装工具 特征提取模块 重构模块 拷贝 覆盖率
系统为您推荐了相关专利信息
1
离散时间自适应动态规划动态事件触发的无人船最优跟踪控制方法
动态触发机制 跟踪控制方法 动态事件触发机制 重构误差 控制策略
2
一种用于工业质检的跨模态知识推理方法、设备及介质
知识推理方法 融合语义 多模态 工业质检 动态权重分配
3
用于开关柜的氦检漏方法和系统
矩阵 拓扑特征 检漏方法 多尺度 数据
4
一种基于智能嗅觉芯片的空调监控系统
空调监控系统 智能嗅觉 空调控制单元 重构误差 数据采集单元
5
基于半监督变分自编码器的工业低流量虚拟检测方法
虚拟检测方法 编码器 无标签数据 变量 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号