摘要
本发明公开了一种基于Sentence‑BERT和KMeans模型的基因功能分类方法和装置。方法包括如下步骤:获得模型所需数据,该模型所需数据后续列出;通过预训练和任务微调,SBERT能更好地捕捉基因功能描述中的细粒度语义差异,将该数据输入到预先训练好的SBERT中生成Sentence Embeddings;将Sentence Embeddings继续输入至KMeans模型中训练经肘部法调参,得到最佳的K值(分类簇数)。本发明基于建立的基因功能总结知识库,通过使用SBERT深度学习模型与KMeans无监督机器学习模型相结合的建模方法为基因的分类提供了可靠的方法。
技术关键词
分类方法
BERT模型
基因
文本
聚类
监督机器学习
深度学习模型
数据
参数
分类装置
标记
建模方法
显示器
语义
存储器
处理器
编码器
误差
分词
纵轴
系统为您推荐了相关专利信息
卷积模型
多尺度结构
环形缓冲区
数据处理方法
时间偏移量
视觉特征
多模态特征融合
计算机程序指令
文本特征向量
图像块