摘要
本发明公开一种可控分子生成方法、系统、设备及介质,涉及分子生成技术领域,该方法包括:获取有机化合物的IUPAC名称和SMILE字符串,并对基于Transformer架构的T5模型进行训练,通过IUPAC编码器提取IUPAC令牌序列内部的化学语义关系,生成IUPAC嵌入向量;通过SMILES编码器学习IUPAC嵌入向量与SMILES令牌序列之间的映射关系;利用解码器生成符合目标属性的SMILES字符串;将待优化有机分子的IUPAC名称输入训练后的T5模型中,生成符合目标属性的分子;该方法通过IUPAC名称的条件控制,能够定向生成特定类别的分子。
技术关键词
令牌
生成方法
分子
序列
编码器
Softmax函数
关系
语义
注意力机制
输入解码器
非线性
模型训练模块
可读存储介质
生成技术
官能团
生成系统
分词
处理器
计算机设备