摘要
本发明涉及一种基于生物大语言模型的发育树推断方法、装置及介质,该方法基于系统发育树生成与优化模型联合优化系统发育树的拓扑结构和分支长度,实现从输入的基因组序列中直接推断系统发育树,其训练过程包括以下步骤:从基因组序列数据中通过预训练语言模型提取嵌入特征;基于提取的嵌入特征,利用树结构生成算法构建初始的系统发育树,并引入潜在变量表示树的拓扑结构;利用拓扑学习组件和分支长度学习组件,迭代优化系统发育树的拓扑结构和分支长度;通过评分函数引导系统发育树生成与优化模型的梯度下降,完成模型训练。与现有技术相比,本发明具有提高了推断精度和鲁棒性等优点。
技术关键词
系统发育树
大语言模型
推断方法
嵌入特征
节点特征
分支
预训练语言模型
变量
生物
特征提取模块
多层感知机
生成算法
序列
解码器
神经网络参数
参数化方法
编码器
系统为您推荐了相关专利信息
隐私保护方法
大语言模型
账户
模板
隐私保护装置
节点特征
节点分类方法
注意力机制
神经网络模型
梯度下降算法
体构建方法
大语言模型
专业知识库
分布式爬虫
图谱
诊疗平台
临床诊断系统
影像诊断系统
颞下颌关节紊乱病
患者