摘要
本申请涉及一种基于预训练大语言模型的蛋白质功能注释方法和装置,应用于人工智能驱动的计算生物领域,其中,该蛋白质功能注释方法包括:将待注释蛋白质序列输入目标蛋白质功能域分类模型,得到待注释蛋白质序列所包含的功能域类别;将待注释蛋白质序列所包含的功能域类别和待注释蛋白质序列,输入目标蛋白质功能域识别模型,得到待注释蛋白质序列的功能域类别所在的目标位置;根据待注释蛋白质序列的功能域类别所在的目标位置,对待注释蛋白质序列进行功能注释。通过本申请,实现了准确且高效识别完整蛋白质序列上的功能域的效果。
技术关键词
蛋白质功能域
大语言模型
序列
注释方法
命名实体识别模型
标签
识别模型训练
分类模型训练
人工智能驱动
位置识别
无监督
编码器
模块
处理器
电子装置
可读存储介质
存储器
核心
计算机
生物
系统为您推荐了相关专利信息
机器阅读理解
情感分析方法
BERT模型
查询机制
编码特征