基于生物分子互作结构域增强的蛋白质序列设计方法

AITNT
正文
推荐专利
基于生物分子互作结构域增强的蛋白质序列设计方法
申请号:CN202411611586
申请日期:2024-11-12
公开号:CN119601074B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种基于生物分子互作结构域增强的蛋白质序列设计方法,包括:先输入一个大小为L×N×3的待进行序列设计的蛋白质主链骨架三维坐标信息;获取与生物分子接触的蛋白质序列和相互作用结构域区间;将获取的序列聚类并取出每个簇的代表序列作为训练集;再提取出每条训练样本的三维结构、二级结构、溶剂可及性和功能注释特征表示;使用LoRA算法微调通用多模态蛋白质语言模型ESM3的最后十层transformer模块,对于位于相互作用结构域区间的掩码残基的损失给予更大的权重;将待进行序列设计的蛋白质主链骨架的原子坐标输入到训练好的模型中,得到目标序列。本发明一方面利用了海量蛋白质的多模态信息;另一方面能生成更加健壮且合理的功能性蛋白质序列。
技术关键词
序列设计方法 三维坐标信息 三维结构 分子 生物 并行算法 多模态 笛卡尔 代表 冗余 训练集 令牌 聚类 参数 数据 标记 周期
系统为您推荐了相关专利信息
1
基于大数据分析的心血管疾病风险评估系统
心血管疾病风险 评估系统 量子态 量子神经网络 量子纠缠交换
2
一种微流控合成装置及利用该装置制备胶体金的方法、产品和应用
胃蛋白酶 蛇形通道 溶液 纸基微流控装置 微流控芯片
3
一种快速构建肝纤维化动物模型的方法
肝纤维化动物模型 小鼠肝纤维化 激酶抑制剂 二甲基亚砜 储存液
4
一种基于GIS与GPS技术的红火蚁监测与数据分析方法
数据分析方法 动态监测数据 热力图 K均值算法 GPS设备
5
一种动物神经自动定量损伤检测系统
损伤检测系统 压榨设备 命令 微机械 监控模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号