摘要
本发明公开了生物信息学技术领域的基于多模态蛋白质语言模型的DNA绑定残基预测方法。该基于多模态蛋白质语言模型的DNA绑定残基预测方法包括以下步骤:将待进行DNA绑定残基预测的蛋白质序列P,依次使用工具分别获取特征文件;将所有特征文件输入ESM3中得到一个嵌入矩阵M;将蛋白质序列处理成残基样本,根据蛋白质结构图搭建等变图神经网络模型,利用已知DNA绑定残基的蛋白质序列构建数据集并训练所搭建的网络;将蛋白质序列的残基样本输入到训练的模型中,得到蛋白质序列的DNA绑定残基。该基于多模态蛋白质语言模型的DNA绑定残基预测方法提高了DNA绑定残基预测的效率与精确性。
技术关键词
多模态
序列
神经网络模型
复合物结构
蛋白质二级结构
生物信息学技术
样本
矩阵
节点特征
标签
多层感知机
训练集
坐标
三维结构
定义
优化器
代表
算法