摘要
本发明公开了一种蛋白质与小分子结合常数预测的方法与存储介质。预测方法包括如下步骤:获取蛋白质的氨基酸序列、小分子的SMILES字符串和蛋白质与小分子之间的结合常数,并将三者组成的预训练数据集输入不同的大语言模型中,并筛选获得基座大语言模型;采用LoRA微调基座大语言模型;优化生成任务中的参数;基于微调后的基座大语言模型和优化后的参数获得预测模型;将待预测的蛋白质的氨基酸序列和小分子的SMILES字符串输入预测模型,输出结合常数。本发明是将生物分子转变为化学语言模式,并且需要同时输入配对的氨基酸序列的字符和小分子的SMILES才可进行推断。本发明可以为药物筛选提供一个决策工具。
技术关键词
大语言模型
分子
评价指标筛选
基座
序列
微调方法
字典
适配器
参数
数据
格式
训练器
可读存储介质
文本
模块
旁路
字符
决策
计算机
处理器
系统为您推荐了相关专利信息
风险评估模型
检测特征序列
预警方法
网络安全评估
注意力机制
课件生成方法
鸽群优化算法
标准化教学
语义结构
网络
电子病历数据
生命体征数据
物联网传感器
平台模块
传输模块