摘要
本发明公开了一种基于自回归式模型的药物设计方法,属于药物设计技术领域。该方法包括:将子词分词算法应用于生物学文本处理,对数据集中的蛋白质与配体信息进行训练,得到蛋白质和配体的分词器,并在此基础上构建自回归模型的分词器;处理并转化数据集中的原始数据为适用于自回归模型的文本形式,再通过所得分词器进行编码,构建自回归模型所需的训练数据集;利用训练数据集训练自回归模型,使其能理解配体的SMILES表示,并学习蛋白质与配体之间的相互作用模式;利用训练过的自回归模型生成预测的配体数据,并通过化学信息工具进行后处理,以获得具有具体化学结构的候选配体;对得到的候选配体进行评估和优化,以确定有潜力成为有效药物的候选分子。
技术关键词
药物设计方法
配体
分词算法
文本
数据
信息工具
蛋白
序列
格式
药物设计技术
深度学习框架
编码
分子
元素
生物
模式
基础
关系
系统为您推荐了相关专利信息
缝纫制品
缺陷管理方法
缺陷检测算法
缺陷管理装置
数据
模型训练方法
历史气象数据
交通流量预测方法
文本
序列
电缆检测方法
预训练模型
样本
数据可视化呈现
电缆检测设备
深度学习算法
风机主轴
监测系统
绝对值编码器
远程上位机