摘要
本发明提供了结合大语言模型和多层次对比学习的药物预测与筛选方法,包括:步骤S1,获取BindingDB数据集和BioSNAP数据集并整合为基准数据集;步骤S2,利用分子大语言模型X‑MOL和蛋白质大语言模型ESM‑2分别基于基准数据集生成分子表征信息和蛋白质表征信息;步骤S3,构建得到基于多层次对比学习方法和transformer架构的药物‑靶标相互作用预测模型;步骤S4,将分子表征信息和蛋白质表征信息输入至药物‑靶标相互作用预测模型中预测得到对应的药物‑靶标相互作用概率值。有益效果是本发明能够提高药物‑靶标相互作用概率预测的泛化性。
技术关键词
靶标相互作用
大语言模型
蛋白质特征提取
筛选方法
分子
药物
特征提取模块
靶蛋白
多层次
样本
数据
学习方法
序列
基准
决策
融合特征
分类器
解码器
系统为您推荐了相关专利信息
分子模型
水溶性
界面
油田驱油技术
分子结构模型
磁异常数据
水雷
磁异常信号
识别方法
海洋磁法探测