摘要
本发明公开了一种基于蛋白语言模型和流匹配的抗菌肽序列快速设计方法和和装置,包括:获取抗菌肽序列数据并预处理后输入至蛋白语言模型的编码器中得到抗菌肽序列的嵌入张量,将嵌入张量根据其统计信息进行归一化后输入至蛋白语言模型的解码器进行解码来设计抗菌肽序列,并对解码器进行微调;将归一化后的嵌入张量、采样时间以及随机噪声向量添加嵌入张量的位置张量后,输入至流匹配模型进行流匹配训练并获得整型流场;通过求解常微分方程从整型流场中解得采样时间步对应的新抗菌肽序列的嵌入张量,并将该新抗菌肽序列的嵌入张量输入至微调后的解码器,解码得到新抗菌肽序列,以解决目前计算机辅助方法计算成本高、速度慢、语义浅等技术问题。
技术关键词
快速设计方法
序列
蛋白
随机噪声
解码器
新抗菌肽
BERT模型
计算机辅助方法
编码器
模型训练模块
线性
存储器
处理器
数据
语义
误差
系统为您推荐了相关专利信息
柔性直流配电网
保护线路
计算机可读指令
电压
保护方法
攻击检测模型
时间段
长短期记忆神经网络模型
主机
攻击检测方法
肝胆外科引流装置
血红蛋白
胆红素
基线
光谱分析装置
图像分割方法
信息熵
轮廓系数
矩阵
脉络膜新生血管
滑动窗口
信息熵
NLOS环境
测距误差
优化卡尔曼滤波