一种基于自回归大模型的核酸序列特征挖掘方法

正文

推荐专利

申请号：CN202410877180

申请日期：2024-07-02

公开号：CN119049566B

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于自回归大模型的核酸序列特征挖掘方法，该方法全程基于无监督式一维核酸序列进行挖掘，基于频率统计法归纳有效k‑mer核苷酸片段，使用提取的k‑mer核苷酸片段作为分割基础，基于无监督式自回归转换器模型上进行特征训练，从而得到密集型高语义信息的序列嵌入特征。本发明实现了基于大规模数据集的无监督学习方法，在降低数据采集和标注实现成本同时将核酸序列信息映射到高维语义空间，实现高密度语义信息的特征提取，为疾病预测分类、药物开发等下游任务提供基础。

技术关键词

核酸序列数据序列特征特征提取网络多头注意力机制挖掘方法无监督核酸序列信息重复序列监督学习方法标识符转换器编码嵌入特征语义频率

系统为您推荐了相关专利信息

一种胸痛中心建设智能匹配的方法

胸痛词语建设智能关键性医院

一种人工智能伪造人脸鉴别方法、装置、设备及存储介质

人脸鉴别方法编码器深度学习模型注意力机制图像处理

基于局部结构优化的归纳式流程挖掘方法及系统

Petri网模型挖掘方法结点日志业务流程执行

基于强化学习的采煤机自适应节能优化系统

节能优化系统优化预测模型采煤机能耗识别模块

一种基于判别量化码字的无监督哈希农业病虫害图像检索方法

图像检索方法码字病虫害图像存储容器注意力

一种基于自回归大模型的核酸序列特征挖掘方法

站点导航

APP 下载