摘要
一种基于深度学习的多模态蛋白质序列生成方法,通过融合蛋白质序列、文本描述的多模态信息,构建得到初始数据集,用于训练基于多模态交互注意力机制的蛋白质序列生成模型;在在线阶段根据实时输入的文本描述和对应的序列数据,通过训练后的模型以自回归生成方法生成符合预期功能和结构的蛋白质序列。本发明通过整合蛋白质序列与文本描述等多模态信息作为输入,采用基于多模态交互注意力机制的蛋白质生成模型,能够有效融合蛋白质序列和文本数据,从而生成高质量的蛋白质序列,本发明在生成远缘同源蛋白质和处理复杂任务中表现出显著优势,并通过实验验证了其在蛋白质质量和结构相似性上的提升。
技术关键词
序列生成方法
多模态交互
注意力机制
文本
位置编码单元
融合蛋白质
序列生成系统
解码器单元
数据处理单元
残差信息
策略
编码器
家族
系统为您推荐了相关专利信息
火焰检测方法
火焰检测模型
燃料电池
采集设备
储氢罐
助手系统
自然语言
知识图谱构建
项目管理模块
设备管理模块
知识图谱生成方法
实体
信息熵
生成知识图谱
变量