蛋白质语言模型预训练与蛋白质突变方法及相关产品

正文

推荐专利

申请号：CN202510997218

申请日期：2025-07-18

公开号：CN120895092A

公开日期：2025-11-04

类型：发明专利

摘要

本公开提供一种蛋白质语言模型预训练与蛋白质突变方法及相关产品。该蛋白质语言模型预训练方法的一具体实施方式通过获取样本蛋白质数据集合；再根据每个该样本蛋白质数据中的多序列比对在各个位点的氨基酸残基概率分布，生成该样本蛋白质数据对应的多序列比对概率分布序列；正向或反向依次串联每个样本蛋白质数据中的样本蛋白质序列以及对应的多序列比对概率分布序列和结构序列，生成与相应样本蛋白质数据对应的多模态序列；最后，基于各样本蛋白质数据对应的多模态序列对蛋白质语言模型进行自回归预训练，得到预训练蛋白质语言模型。即，通过引入多序列比对概率分布序列作为独立的中间推理模态，以及两个方向思维链，提升模型预测性能。

技术关键词

序列多模态样本模型预训练位点数据获取模块标识策略处理器下轮计算机程序产品蛋白存储装置可读存储介质电子设备指令

系统为您推荐了相关专利信息

一种机器人异常动作检测方法、装置、系统以及存储介质

关节动作检测方法数据序列机器人

一种基于AI智能驱动的借贷风险评估系统

风险评估系统信用评估模型样本数据处理模块数据采集模块

基于双通道的芯片间数据传输方法和系统

信号线通道时间片频带分配高阶信号调制

用于内窥镜的去遮挡图像显示装置、方法及电子设备

多孔径矫正子孔径图像微透镜阵列图像传感器

一种基于多源机会信号深度学习的三维空间定位方法及系统

深度神经网络模型坐标点三维空间定位方法样本三维空间定位系统

蛋白质语言模型预训练与蛋白质突变方法及相关产品

站点导航

APP 下载