摘要
本发明公开了一种基于扩散模型的酶序列生成方法,属于生物信息技术领域。为实现在分类指导条件下,首先通过独热编码和ESM‑1b模型构建多模态数据,然后建立了基于Stable Diffusion模型与结合了全局注意力与局部注意力机制去噪模块的深度学习模型。同时,本申请验证了在可控生成蛋白质序列任务中表现,结果显示,在结构预测置信度、结构相似性和序列同源性方面优于其他模型。
技术关键词
局部注意力机制
序列生成方法
生物信息技术
数据
深度学习模型
多模态
编码
噪声
模块
解码器
网络
聚类
参数
标识
关系