摘要
本发明提供一种基于序列信息的蛋白质毒性预测方法和系统,方法包括从蛋白质数据库中获取多个蛋白质序列;对所有蛋白质序列进行特征计算,得到六大类蛋白质特征向量;将六大类特征向量按列拼接,得到第一特征向量;对第一特征向量进行降维筛选,得到目标维度的第二特征向量;利用第二特征向量训练基于图注意力的神经网络模型,并将训练好的神经网络模型作为蛋白质毒性预测模型;将新的蛋白质序列输入至蛋白质毒性预测模型,得到蛋白质毒性预测模型输出的毒性预测结果。本发明能够适应不同类型的蛋白质序列,通过学习到的通用序列模式对蛋白质毒性准确预测。
技术关键词
序列
毒性预测方法
神经网络模型
门控循环单元
注意力
表达式
三元组
空间分布特征
预测系统
频率
网络模块
输出特征
描述符
模型训练模块
分类器
二肽
拼接模块
关系
矩阵
系统为您推荐了相关专利信息
聚类推荐方法
分布式数据采集
图谱
分布特征
PageRank算法
智能调光控制方法
LED驱动器
PWM调光控制
分段线性函数
控制策略