摘要
一种基于深度学习和化学领域相结合的ChemBERTa‑FP抗癌药物预测方法,包括下列步骤:步骤1:获取CI‑60DTP数据库的数据和ChEMBL数据库的数据;步骤2:使用了ChemBERTa和BERT_base作为基础预训练模型;BERT base预训练了一个深度双向语言表示模型,用一个额外的输出层对预训练的BERTbase模型进行调整,从而在不进行重大架构修改的情况下为广泛的任务创建模型;同时,使用ChemBERTa作为基础预训练模型,其基于RoBERTa作为基础模型,并在PubChem 77M数据集上进行了预训练,通过在训练中加入特定的化学语言SMILES;步骤3:ChemBERTa的模型向量表示的维度是384,头数为12,Transformer的层数为6。本发明创新地利用ChemBERTa和BERT‑base两种深度学习模型于抗癌分子筛选领域,这是此类模型的首次应用。
技术关键词
抗癌药物
预训练模型
细胞系
数据集构建方法
代表
深度学习模型
肿瘤
基础
指纹特征
传播算法
分子
优化器
化学式
训练集
指标
定义
参数
线性
数值
系统为您推荐了相关专利信息
RBF神经网络
净负荷预测方法
电力系统
神经网络输出层
注意力机制
航天器总体设计
模型训练方法
实体消歧
图谱
预训练模型