摘要
本发明涉及一种基于深度学习的蛋白质隐式结合位点的预测方法。该方法包括四个阶段:数据采集、特征工程、模型训练和验证应用。首先,从蛋白质数据库获取初始数据并进行数据筛选和序列冗余度消除,标准化处理PDB结构文件,生成样本;然后,构建包含基础蛋白特征和进化保守特征的复合特征空间;接着,通过层次化特征转换和集成特征选择方法实现特征降维,构建模型;最后,验证应用表明该方法在954个非冗余蛋白质结构上获得99.44%的预测准确率,ROC‑AUC和PR‑AUC均达到0.9998,且与BioLiP数据库重叠率为44.4%。本发明能够准确识别潜在药物结合位点,尤其对难成药靶点表现出良好的泛化能力,具有重要的应用前景。
技术关键词
集成特征选择方法
位点
隐马尔可夫模型
机器可读指令
图形化操作界面
深度学习模型训练
冗余度
矩阵
特征工程
序列
电子设备
样本
非线性
阶段
捕获特征
处理器
数据存储模块
注意力机制
系统为您推荐了相关专利信息
标量特征
位点预测方法
描述符
并行集成学习
多层感知器
幕墙面板结构
拼装施工方法
双曲面铝板
框架单元
杆件
智能预警系统
情感特征
意图分类模型
语义特征
意图类别
深度信念神经网络
时空图卷积神经网络
高斯混合模型
转移概率矩阵
永磁电机