摘要
本发明公开了一种基于深度学习模型对于ncRNA与蛋白质相互作用的预测方法,使用的是公共数据库四个数据集(RPI488,NPInter2.0,RPI1807,RPI7317),kmer编码策略对ncRNA和蛋白质的序列进行提取高维稀疏特征后,通过Embedding层将稀疏特征映射为低维稠密向量;使用ResNet结合SE注意力机制提取关键的局部特征;随后通过Transformer利用位置编码和多头注意力捕捉长程依赖并提取全局特征;最终,将ResNet和Transformer的特征与线性变换后的蛋白质特征拼接,并通过DNN层进一步提炼特征后使用Sigmoid激活函数输出分类概率。通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用k‑mer进行特征编码,不需要生物学的先验知识,并且通过局部特征提取与全局特征建模相结合的方式,充分捕获序列中的关键信息,利用深度学习的计算方法提高了预测ncRNA与蛋白质相互作用的准确率。
技术关键词
稀疏特征
编码策略
深度学习模型
多头注意力机制
局部特征提取
正则化技术
上下文特征
序列特征
输出特征
融合特征
数据
计算方法
编码器
模块
模式
关系
系统为您推荐了相关专利信息
体积计算方法
特征提取模块
面点
激光雷达点云数据
粮仓
模糊逻辑算法
电网调度数据
采集用电设备
深度学习模型
物联网控制器
轨迹特征
轨迹恢复方法
前馈神经网络
注意力模型
深度学习模型
产量预测方法
遥感图像数据
玉米
农作物产量预测技术
改进型植被指数