摘要
本发明提供一种基于跨模态预训练的小分子生成方法、装置及电子设备,其中的方法包括:获取给定的蛋白质口袋;获取蛋白质口袋的目标表示向量;基于预先训练的分子生成模型,根据目标表示向量,生成蛋白质口袋对应的配体小分子;其中,分子生成模型根据类药小分子样本及其对应的表示向量样本构成的训练样本集进行训练优化得到,表示向量样本通过分子编码器编码并减小模态间隙得到,用于模拟类药小分子样本对应蛋白质口袋样本的表示向量,分子编码器为预训练的对比学习模型。该方法通过预训练的对比学习模型将蛋白质口袋与配体小分子在表示空间中对齐,使用单模态的类药小分子数据无监督学习跨模态的蛋白质‑小分子配对任务,能够准确捕捉到药物分子的化学结构与构象的分布,摆脱对实验数据的依赖,生成了具有更合理几何结构和更接近真实药物分子结构分布的药物小分子,并提高了所生成药物小分子的可合成性、与靶点之间的亲和力。
技术关键词
分子
口袋
跨模态
训练样本集
生成方法
编码器
配体
非暂态计算机可读存储介质
无监督学习
电子设备
处理器
数据
计算机程序产品
药物
生成装置
亲和力
存储器
噪声
系统为您推荐了相关专利信息
南五味子
时间预测模型
描述符
数据管理软件
联苯环辛烯
编码特征
图像检索模型
图像编码器
图像块特征
时间序列特征
检测网络模型
特征提取器
全局信息融合
训练样本集
对齐模块