摘要
本发明提供了一种引入蛋白质大语言模型编码的肽段二级谱图预测方法,包括:获取蛋白质的肽段,并采用预设的编码算法对肽段的肽段信息进行编码,得到肽段的编码向量;其中,编码算法包括:基于蛋白质大语言模型编码、索引编码和独热编码;基于编码向量和谱图预测模型,得到肽段的碎片离子强度;将碎片离子强度转换为肽段的二级谱图。本发明提高了肽段的二级谱图预测的准确性。
技术关键词
编码向量
大语言模型
编码算法
序列
离子
标识符
计算机可执行指令
强度
编码模块
索引
可读存储介质
处理器
矩阵
预测装置
解码
存储器
线性
电子设备
系统为您推荐了相关专利信息
指令
信息存储模块
电流值
计算机程序产品
保护芯片
稳定输出功率
风力发电机组
风电发电机组
数据共享平台
电力
深度学习混合模型
指数预测方法
双向长短期记忆
BiLSTM模型
深度学习模型