摘要
本发明公开了生物信息学领域中预测非模式生物必需基因的数据处理装置及方法与应用。本发明所要解决的技术问题是如何筛选非模式生物的必需基因。本发明将目标物种的蛋白质序列和n种模式生物物种的蛋白质序列分别基于注释得到每种蛋白对应的标签;然后将蛋白质序列和标签嵌入蛋白质语言模型,输出嵌入向量;基于该嵌入向量为每一个蛋白质构建残基接触图;将残基接触图中每个氨基酸残基的特征使用图神经网络进行建模整合输出得到整体的蛋白质嵌入向量;将所有蛋白质嵌入向量输入分类器模型进行训练并使用激活函数输出蛋白质基因的必需概率值;基于分类器模型获得蛋白质所基因的必需概率值P1。本发明可应用于农业病害防控和生物农药开发。
技术关键词
蛋白互作网络
分类器模型
数据处理装置
生物物种
基因
生物农药开发
神经网络模型
RNA干扰靶点
农业病害
组学特征
计算机程序产品
序列
模式
标签
可读存储介质
处理器
注意力
节点
非线性
系统为您推荐了相关专利信息
突变体
斑马鱼胚胎
抗体
基因敲除技术建立
疫苗佐剂
医疗数据处理方法
项目
训练预测模型
文本
训练样本数据
大语言模型
图像生成网络
多模态信息
文本
编码模块