摘要
本申请公开了一种基于RLAIF的蛋白质语言模型对齐方法及装置。所述训练方法包括:获取用于预测蛋白质的氨基酸序列的目标任务;基于目标任务,生成与目标任务对应的第一输入数据集;将第一输入数据集输入到预先训练的基于RLAIF的蛋白质语言模型,得到第一输出数据集;将第一输出数据集输入到预设蛋白质结构预测模型,得到第二输出数据集;根据第二输出数据集,确定用于量化蛋白质折叠状态的稳定性的最优评估模型,作为打分模型;将第一输出数据集输入到打分模型,得到对应的奖励值输出数据;根据奖励值输出数据,调整预训练的基于RLAIF的蛋白质语言模型的各个参数,得到训练后的基于RLAIF的蛋白质语言模型。
技术关键词
蛋白质折叠
蛋白质结构预测
数据
序列
对齐方法
计算机程序产品
预测装置
训练装置
计算机可执行指令
参数
处理器
模块
传播算法
格式
存储器
系统为您推荐了相关专利信息
油菜品种
评估系统
时序神经网络
土壤特征
作物生长态势
神经网络训练
图像重建方法
数据分布
噪声强度
散射成像
动态负载均衡方法
链路
数据中心
粒子群算法
节点
故障预测模型
变压器运行状态
马尔可夫链模型
朴素贝叶斯模型
集成策略