摘要
本发明公开了一种用于RNA甲基化位点预测的方法,基于多模态特征融合与语义向量嵌入技术,显著提高m7G修饰位点的识别精度。首先,构建包含正负样本的RNA序列数据集,并按预定比例划分为训练集与独立测试集。然后,通过独热编码(One‑hot)、核苷酸化学性质编码(NCP)、电子‑离子相互作用电位编码(EIIP)以及局部核苷酸组成编码(ENAC)提取多模态特征,结合DNA2Vec模型获取核苷酸序列的上下文语义信息。模型采用多模态特征融合通路(MRF)与DNA2Vec嵌入通路,经过全连接层进行特征维度压缩后,利用Transformer编码器捕获长程依赖关系,并通过Sigmoid激活函数计算预测概率。在优化过程中,采用批量归一化、Dropout及Adam优化器,最小化二元交叉熵损失函数。最终,通过五折交叉验证评估模型性能,并在独立测试集上验证其泛化能力。该方法通过多源特征融合与层次化建模,显著提升了序列信息的解析能力,为RNA修饰预测提供了一个精确的计算工具。
技术关键词
多模态特征融合
上下文语义信息
多源特征融合
核苷酸
语义向量
位点
序列
模型优化方法
跨模态
编码器模块
优化器
深度神经网络
压缩特征
通道
样本
编码方案
系统为您推荐了相关专利信息
语义知识图谱
语义向量
计算机自然语言
语义匹配算法
深度学习模型
Attention机制
识别方法
语义向量
电力
数据
动态表征方法
大数据
多模态
高阶奇异值分解
建筑施工数据
图像特征向量
细粒度特征
跨模态
特征提取网络
补偿式