摘要
本申请提供了一种分子数据处理模型的训练方法、分子数据处理方法、装置、设备、存储介质及程序产品;方法包括:对分子标记器迭代执行多个训练批次,其中,在每个训练批次中执行以下处理:通过分子标记器对分子描述文本、分子图数据和当前训练批次的第一查询向量序列进行特征交互处理,得到交互查询序列,基于交互查询序列查询当前训练批次的编码本,得到分子标记序列,基于交互查询序列和分子标记序列确定第一损失值,基于第一损失值更新分子标记器、第一查询向量序列以及编码本;基于多个训练批次后的分子标记器,执行分子数据处理模型的训练任务。通过本申请,能够提升多模态数据表示的一致性,以及提升分子数据处理模型的泛化能力。
技术关键词
数据处理模型
分子
语言理解模型
序列
标记器
文本
嵌入特征
注意力
数据处理方法
转换器
计算机可执行指令
编码向量
样本
编码特征
数据处理模块
多模态
数据处理装置
掩码矩阵
系统为您推荐了相关专利信息
动态贝叶斯网络
风险评价方法
节点
概率分布函数
物流
电力负荷预测方法
交叉注意力机制
多层感知器
序列
线性变换矩阵
基因编码技术
序列
恶意样本
恶意软件检测方法
内存