摘要
本发明提出了一种基于纳米孔测序的糖基化RNA修饰鉴定模型构建方法和系统,属于新一代信息技术中RNA修饰鉴定技术领域。从多种公共数据库来源融合二代/三代测序数据建立包含碱基特征序列、电流信号特征序列、各碱基修饰类型的高置信度训练集;利用训练集中的修饰类型规模较大的样本子集预训练一个基于跨模态特征融合和多尺度序列建模的RNA修饰鉴定模型,再利用修饰类型规模较小的样本子集对预训练的RNA修饰鉴定模型进行微调,得到适配糖基化RNA的修饰鉴定模型。本发明的修饰鉴定模型在不同细胞系的修饰特征检测中表现出良好的适应性,显著提升了稀有修饰的学习效率和预测精度,尤其支持少量糖基化RNA样本的修饰类型鉴定。
技术关键词
模型构建方法
纳米孔
二代测序数据
信号特征
电流
样本
位点
序列
跨模态
训练集
交叉注意力机制
模型构建系统
新一代信息技术
数据收集模块
模型训练模块
数据校准
分析工具
规模