摘要
本发明公开了一种基于多模态指令指导的蛋白质设计方法和装置,包括:从SwissProtCLAP数据集中随机抽取成对的文字指令和蛋白质序列作为单个样本,并构建样本集;先利用文字指令得到文字形式的生成条件作为一模态指令,再把文字形式的生成条件跨模态转换为蛋白形式的生成条件作为另一模态指令,从而得到多模态指令;构建蛋白质设计模型,其包含融合多模态指令的多模态融合器和处理多模态指令并进行蛋白质设计的解码器,并利用样本集对蛋白质设计模型进行基于蛋白质序列的监督训练;利用训练好的蛋白质设计模型进行蛋白质序列设计,并对设计的蛋白质序列进行可视化,以解决实际应用中蛋白质设计空间有限的技术问题。
技术关键词
蛋白质设计方法
多模态
指令
序列
跨模态
样本
解码器
高斯分布模型
三维结构
融合器
可视化工具
自然语言
模块
存储器
处理器
注意力
有效性
编码器
数据
系统为您推荐了相关专利信息
图像传感器
校正
色彩还原方法
色彩滤波阵列
颜色
融合特征
航迹生成方法
知识蒸馏方法
一体化网络架构
模态特征
关联性分析方法
灰色关联分析
传动链部件
灰色关联度
多源异构监测数据