摘要
本发明公开了一种基于人工智能的药物稳定性预测方法及系统,涉及药物发现技术领域,所述方法包括:获取非冗余蛋白质的序列信息,构建蛋白质大语言模型,利用非冗余蛋白质的序列信息训练蛋白质大语言模型,对模型参数进行微调,利用蛋白质大语言模型和多肽的理化性质进行多肽稳定性预测。本发明实现了对新的多肽的稳定性预测,输出其半衰期回归和潜在酶解位点,以提供氨基酸位点修饰的指导。该模型对比现有的模型,其训练成本低,计算复杂度低,此外在对适应任务微调上,本发明仅需调整少量的参数减少了模型训练的时间,也避免了由于微调带来的灾难性遗忘。
技术关键词
稳定性预测方法
大语言模型
多肽
位点
序列
药物发现技术
联合损失函数
冗余
可读存储介质
靶标
数据采集模块
线性
参数
预测系统
水解酶
计算机
蛋白
复杂度