摘要
本发明公开了一种基于知识增强语言模型的蛋白质相互作用调节剂预测方法,包括,调节剂模型构建:预训练文本编码器,引入基于指纹的结构编码器,拼接文本编码器输出的文本嵌入和结构编码器输出的多种指纹嵌入生成调节剂特征;蛋白质模型构建:收集GO图和GO注释,基于GO图训练图嵌入模型,使用训练后的图嵌入模型为每个GO术语节点生成结构特征,结合GO术语的结构特征输出GO术语嵌入向量,基于多个GO术语嵌入向量生成蛋白质特征;预测模型构建:以调节剂特征和蛋白质特征为输入,输出相互作用特征,并基于相互作用特征输出预测结果。本方案通过自然语言的细微表达与生物分子结构属性的融合实现了蛋白质相互作用调节剂预测性能的有效提升。
技术关键词
结构编码器
术语
文本编码器
相互作用特征
训练语料库
指纹
生成调节剂
BERT模型
编码器架构
可读存储介质
节点
标记器
预测系统
定义
令牌
邻居
系统为您推荐了相关专利信息
预训练模型
视频数据处理方法
跨模态
时间段
样本
细粒度特征
融合特征
多粒度特征
编码器训练
图文
视觉特征编码
多尺度特征
评价系统
嵌入特征
融合特征
编码器模块
适配器
编码特征
特征金字塔网络
注意力