摘要
本发明公开了一种具备生物可解释性的环状RNA自动识别方法,属于生物信息学和计算机技术领域。该方法通过从数据库获取序列数据并预处理,提取反向补体匹配和ALU重复元件特征,利用MRMD2.0算法筛选特征后,构建卷积神经网络与双向长短期记忆网络结合的深度模型进行分类训练,再通过SHAP方法分析特征贡献,最终将模型应用于多种场景。该方法可精准捕捉circRNA环化关键特征,自动学习高阶特征表示以提升分类准确率,同时揭示特征生物学机制,实现circRNA与PCG区分及干细胞表达预测等多任务迁移,弥补了现有算法在特征表征和可解释性方面的不足。
技术关键词
自动识别方法
双向长短期记忆网络
多层卷积神经网络
构建卷积神经网络
深度神经网络模型
特征选择
样本
补体
分类准确率
排序算法
环状
序列特征
生物
元件
网络结构
多任务
优化器
数据