一种采用渐近式搜索MSA的蛋白质系综预测方法

AITNT
正文
推荐专利
一种采用渐近式搜索MSA的蛋白质系综预测方法
申请号:CN202510048792
申请日期:2025-01-13
公开号:CN119964645B
公开日期:2025-11-28
类型:发明专利
摘要
一种采用渐近式搜索MSA的蛋白质系综预测方法,首先,给定目标蛋白质序列,使用MMSeqs生成MSA。然后,使用DBSCAN方法对每个MSA进行聚类,生成多个子MSA;对于聚类失败的MSA,采用高斯混合模型(GMM)进行期望最大化(EM)聚类;接着,使用BLAST序列比对方法,从每个子MSA中选出相似度最高的序列,再次利用MMSeqs生成新的MSA,将所有子MSA合并为一个新的MSA,去除完全相同的序列,并对长度不一致的序列使用MAFFT添加GAP;处理后的MSA再次聚类,最终输入AlphaFold2生成蛋白质系综。本发明有效利用MSA共进化信息以预测蛋白质动态系综。
技术关键词
序列比对方法 高斯混合模型 概率密度函数 聚类 协方差矩阵 数据 邻域 参数 核苷酸 家族 校正 蛋白 因子 核心 指标 代表 动态
系统为您推荐了相关专利信息
1
一种数据处理方法、电子设备及存储介质
异常数据 数据处理方法 轮廓系数 评估算法 场景
2
一种检测方法和装置、电子设备及介质
空间权重矩阵 全局平均池化 通道 上存储计算机程序 多尺度特征融合
3
一种国土空间规划数据信息交互方法及移动终端
多用户协同编辑 国土空间规划 数据验证系统 数据安全传输方法 数据交互方法
4
一种基于多源数据融合的动态渲染引擎实现方法及系统
传感器 协方差矩阵 层级 卡尔曼滤波 动态
5
一种基于大数据的胃肠道疾病术后康复方法及系统
胃肠道疾病 康复方法 实时数据 患者 大数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号