摘要
本发明提供了一种基于改进Transformer和SE‑TextCNN的RNA亚细胞定位预测方法,包括以下部分:建立LncRNA和mRNA数据集,对LncRNA和mRNA数据集进行预处理,筛选并清洗数据;进行特征提取,并分别输入到神经网络的各个位置;特征包括One‑hot编码、EIIP编码、NCP编码、位置编码及RNA‑FM编码,可综合序列物理化学属性和RNA‑FM模型通过自监督学习得到深层次特征;训练网络框架,采用二路并行策略分别对RNA‑FM输出的特征以及基础序列特征进行训练,依次经过Lightning Attention Transformer模块、TextCNN‑SEnet模块和MLP模块输出预测结果。本发明有效增强了对长序列的处理能力和对关键特征的识别,有效提高了RNA亚细胞定位的预测精度,且本发明的模型可应用于其他RNA类型的数据集,也展现了鲁棒的预测性能。
技术关键词
定位预测方法
并行策略
序列特征
数据
预训练模型
核苷酸
编码模块
基础
编码器
框架
网络
阶段
精度
通道
系统为您推荐了相关专利信息
注意力机制算法
数据
语音识别分析
查询方法
特征提取方法
三维激光扫描技术
隧洞
洞口
长短期记忆神经网络
数据
驱动控制器
车辆运行参数
主控芯片
实时信息
策略