摘要
本发明涉及生物信息学与计算生物学交叉领域,揭露了一种基于大语言模型的转录组注释方法及系统,包括:将单细胞空间坐标与基因表达值融合为伪图像模态数据,提取伪图像模态数据的空间拓扑特征;将空间拓扑特征与预设的医疗数据库之间进行跨模态对齐,分析跨模态嵌入向量的细胞类型概率;构建功能描述文本的功能语义空间,将非模式物种投影至功能语义空间中;计算基因表达嵌入与参考物种的同源基因之间的语义相似度,利用大语言模型将基因表达嵌入转换为语义映射关系。本发明通过减少单细胞空间转录组注释中面临空间拓扑建模粗放、跨模态对齐精度低、非模式物种注释受限及语义映射僵化等核心问题。
技术关键词
大语言模型
注释方法
拓扑特征
基因
跨模态
像素点
坐标
文本
图像
语义向量
样本
节点
注释系统
图谱
关系
数据
键值
持久性
模式
系统为您推荐了相关专利信息
数据
编码向量
检测模型训练方法
训练流量检测模型
流量检测方法
视频生成方法
视频生成模型
文本
目录
大语言模型
预测交通流数据
交通流预测方法
大语言模型
对齐模块
编码器