一种采用渐近式搜索MSA的蛋白质系综预测方法

AITNT
正文
推荐专利
一种采用渐近式搜索MSA的蛋白质系综预测方法
申请号:CN202510048792
申请日期:2025-01-13
公开号:CN119964645B
公开日期:2025-11-28
类型:发明专利
摘要
一种采用渐近式搜索MSA的蛋白质系综预测方法,首先,给定目标蛋白质序列,使用MMSeqs生成MSA。然后,使用DBSCAN方法对每个MSA进行聚类,生成多个子MSA;对于聚类失败的MSA,采用高斯混合模型(GMM)进行期望最大化(EM)聚类;接着,使用BLAST序列比对方法,从每个子MSA中选出相似度最高的序列,再次利用MMSeqs生成新的MSA,将所有子MSA合并为一个新的MSA,去除完全相同的序列,并对长度不一致的序列使用MAFFT添加GAP;处理后的MSA再次聚类,最终输入AlphaFold2生成蛋白质系综。本发明有效利用MSA共进化信息以预测蛋白质动态系综。
技术关键词
序列比对方法 高斯混合模型 概率密度函数 聚类 协方差矩阵 数据 邻域 参数 核苷酸 家族 校正 蛋白 因子 核心 指标 代表 动态
系统为您推荐了相关专利信息
1
基于电子元器件的数据库构建方法及系统
电子元器件 数据库构建方法 引脚功能 数据库构建系统 矩阵
2
一种基于身份的加密方法、系统、电子设备及存储介质
加密方法 身份 生成私钥 协方差矩阵 明文
3
一种面向城市空中交通场景的低空空域航道划设方法
划设方法 轨迹 密度 DTW算法 初始聚类中心
4
一种空气中有机物排放通量的智能评估方法
时间段 智能评估方法 质谱 数据 序列
5
一种可移动液晶显示屏的智能调控方法及系统
智能调控方法 液晶显示屏 数据 聚类 显示调节技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号