一种用于识别RNA甲基化位点的预测方法

正文

推荐专利

一种用于识别RNA甲基化位点的预测方法

申请号：CN202510428519

申请日期：2025-04-08

公开号：CN120299525A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种用于RNA甲基化位点预测的方法，基于多模态特征融合与语义向量嵌入技术，显著提高m7G修饰位点的识别精度。首先，构建包含正负样本的RNA序列数据集，并按预定比例划分为训练集与独立测试集。然后，通过独热编码（One‑hot）、核苷酸化学性质编码（NCP）、电子‑离子相互作用电位编码（EIIP）以及局部核苷酸组成编码（ENAC）提取多模态特征，结合DNA2Vec模型获取核苷酸序列的上下文语义信息。模型采用多模态特征融合通路（MRF）与DNA2Vec嵌入通路，经过全连接层进行特征维度压缩后，利用Transformer编码器捕获长程依赖关系，并通过Sigmoid激活函数计算预测概率。在优化过程中，采用批量归一化、Dropout及Adam优化器，最小化二元交叉熵损失函数。最终，通过五折交叉验证评估模型性能，并在独立测试集上验证其泛化能力。该方法通过多源特征融合与层次化建模，显著提升了序列信息的解析能力，为RNA修饰预测提供了一个精确的计算工具。

技术关键词

多模态特征融合上下文语义信息多源特征融合核苷酸语义向量位点序列模型优化方法跨模态编码器模块优化器深度神经网络压缩特征通道样本编码方案

系统为您推荐了相关专利信息

一种基于计算机自然语言处理的搜索方法及系统

语义知识图谱语义向量计算机自然语言语义匹配算法深度学习模型

一种适用于不平衡小样本电力敏感数据的识别方法及系统

Attention机制识别方法语义向量电力数据

一种基于检索增强生成的端到端的大模型微调方法和系统

微调方法语义向量文本模块微调系统

多模态建筑施工大数据的智能感知、融合与动态表征方法

动态表征方法大数据多模态高阶奇异值分解建筑施工数据

一种地质勘测用岩石矿物含量检测系统及方法

图像特征向量细粒度特征跨模态特征提取网络补偿式

一种用于识别RNA甲基化位点的预测方法

站点导航

APP 下载