一种基于自回归大模型的核酸序列特征挖掘方法

AITNT
正文
推荐专利
一种基于自回归大模型的核酸序列特征挖掘方法
申请号:CN202410877180
申请日期:2024-07-02
公开号:CN119049566B
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种基于自回归大模型的核酸序列特征挖掘方法,该方法全程基于无监督式一维核酸序列进行挖掘,基于频率统计法归纳有效k‑mer核苷酸片段,使用提取的k‑mer核苷酸片段作为分割基础,基于无监督式自回归转换器模型上进行特征训练,从而得到密集型高语义信息的序列嵌入特征。本发明实现了基于大规模数据集的无监督学习方法,在降低数据采集和标注实现成本同时将核酸序列信息映射到高维语义空间,实现高密度语义信息的特征提取,为疾病预测分类、药物开发等下游任务提供基础。
技术关键词
核酸序列数据 序列特征 特征提取网络 多头注意力机制 挖掘方法 无监督 核酸序列信息 重复序列 监督学习方法 标识符 转换器 编码 嵌入特征 语义 频率
系统为您推荐了相关专利信息
1
一种胸痛中心建设智能匹配的方法
胸痛 词语 建设智能 关键性 医院
2
一种人工智能伪造人脸鉴别方法、装置、设备及存储介质
人脸鉴别方法 编码器 深度学习模型 注意力机制 图像处理
3
基于局部结构优化的归纳式流程挖掘方法及系统
Petri网模型 挖掘方法 结点 日志 业务流程执行
4
基于强化学习的采煤机自适应节能优化系统
节能优化系统 优化预测模型 采煤机 能耗 识别模块
5
一种基于判别量化码字的无监督哈希农业病虫害图像检索方法
图像检索方法 码字 病虫害图像 存储容器 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号