摘要
本申请涉及一种RNA序列修饰预测模型的训练方法、预测方法及相关装置。所述方法包括:获取RNA序列的修饰位点测序数据;基于修饰位点测序数据中具有目标化学修饰的位点和不具有目标化学修饰的位点,分别得到长度不同的多种正样本序列和在中心位置添加有不同碱基的多种负样本序列,以此构建多层次分类数据库;将多层次分类数据库中的每个样本序列分别输入待训练的修饰预测模型,得到每个样本序列的修饰位点的预测结果;基于预测结果和每个样本序列的实际情况,对待训练的修饰预测模型的模型参数进行更新,直到得到训练后的修饰预测模型。与现有技术相比,本申请能够对提高模型的训练效率和精度。
技术关键词
序列
注意力
样本
位点
多层次
细胞系
模块
数据
聚类
编码
腺嘌呤
参数
算法
精度