摘要
本发明公开一种基于知识蒸馏和强化学习的多约束分子生成方法,属于药物分子生成模型技术领域。其包括对预先训练好的代理模型设置生成分子的最大长度,通过对所述代理模型进行模型推理,输出符合多种属性约束条件的分子;其中,所述代理模型的训练包括:采用条件变压器,基于目标属性约束条件和分子SMILES表达式数据进行训练得到先验模型;采用三层循环单元的蒸馏RNN模型,学习所述先验模型中采样的分子的似然分布,并使用强化学习方法对蒸馏RNN模型进行微调,得到代理模型;本发明通过预处理生成模型而不影响其在多约束任务中输出多样性的同时,提高分子生成模型输出所需分子的效率。
技术关键词
生成方法
RNN模型
分子
蒸馏
强化学习方法
属性预测模型
强化学习算法
表达式
变压器
令牌
数据
解码器
注意力
编码器
定义
药物