摘要
本发明公开了一种sgRNA的靶标活性预测方法,包括如下步骤:步骤1:数据集准备,获取sgRNA活性序列数据集;步骤2:对sgRNA活性序列数据集进行序列特征提取,得到多个特征信息;步骤3:将多个特征信息进行融合,得到特征集;步骤4:构建基于图加权对抗网络的不平衡数据集处理算法;步骤5:引入集成学习,构建基于投票算法的深度学习预测模型;步骤6:对sgRNA高活性序列的保守基序分析。本发明的方法可以保证模型的预测效果及鲁棒性,通过多样化的基学习器可以捕捉数据的不同特性,降低过拟合风险,能够高效地提取序列特征,显著提高了预测精度和效率;且对模型的生物学意义进行探索,对模型进行了可解释分析的尝试。
技术关键词
活性预测方法
特征提取算法
深度学习预测模型
靶标
分类器
投票算法
核苷酸
数据
结构特征提取
网络
预测类别
序列特征
样本
节点
分布特征
学习器
鲁棒性
标签