摘要
本发明提供一种小分子活性优化方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,方法包括:获取待优化小分子的序列化结构表示和基于自然语言的活性优化指令;将所述序列化结构表示和所述活性优化指令拼接后,输入至预训练的多模态分子编辑模型中,通过两阶段解码输出优化后的优化小分子;其中,所述多模态分子编辑模型为:基于小分子活性优化数据集对多模态机器学习模型进行训练得到,所述多模态机器学习模型通过联合学习分子结构表示和自然语言指令建立跨模态关联。通过本发明提供的方法,采用自然语言对生物活性实验及活性判别准则进行建模,有效地提升了模型的泛化能力和易用性,有效克服了现有技术在生物活性优化场景中的局限性。
技术关键词
多模态机器学习
分子
自然语言
骨架识别
编辑
两阶段
机器学习模型
指令
非暂态计算机可读存储介质
跨模态
官能团
序列
标记
数据
优化场景
电子设备
判别准则
解码
大语言模型
系统为您推荐了相关专利信息
交互系统
语音识别模块
文本
对照数据库
自动语音识别
非玩家角色
环境感知信息
三维虚拟环境
自然语言
文本
配电网规划
报告生成方法
自然语言理解模型
数据库表结构
报告生成装置