摘要
本发明公开了一种基于多模态对比学习的分子文本联合理解与编辑方法,旨在提升分子设计与优化过程的语义控制能力与检索效率。该方法包括:利用分子图编码器与预训练自然语言文本编码器,基于分子‑文本对采用对称InfoNCE损失进行对比学习训练,从而得到对分子结构和自然语言文本两种模态具有较好理解的模型。通过设计适配器模块对齐分子文本嵌入空间与预训练分子生成器,并在对齐后的潜在空间中进行向量操作,实现基于自然语言的分子属性编辑与生成;同时采用向量相似度检索,实现分子结构与文本描述的双向检索任务。该方法无需针对不同任务重新训练生成模型,具备高度的灵活性与可扩展性,适用于药物分子设计、性质优化及多模态化学信息处理等场景。
技术关键词
分子
编辑方法
多模态
自然语言文本
文本编码器
编码器模块
编辑系统
数据处理模块
信息处理
样本
适配器
解码器
语义
变量