一种基于二次微调和集成算法的DNA甲基化位点预测方法

正文

推荐专利

申请号：CN202411482977

申请日期：2024-10-23

公开号：CN119380811B

公开日期：2025-09-09

类型：发明专利

摘要

本发明公开了一种基于二次微调和集成算法的DNA甲基化位点预测方法，属于生物信息学技术领域。本发明将UCSC数据库中获得的人类DNA启动子序列经过1‑mer、3‑mer和5‑mer分词后作为语料库对BERT模型进行预训练，形成Promoter‑BERT模型，实现了对DNA启动子序列中深层特征的捕获和抽象，为后续的微调提供了高效且稳健的初始状态；利用3种甲基化的最大的三个数据集对Promoter‑BERT模型进行第一次微调，并利用数据量较小的14个数据集进行了模型的第二次微调，可以使模型更加专注于学习该数据集特有的特征，从而更好地适应特定任务，这有助于模型在目标任务上获得更高的准确性和性能，减少过拟合的风险。

技术关键词

BERT模型位点预测方法集成算法启动子分词序列生物信息学技术数据模型预训练预训练模型参数策略人类标记风险周期基础

系统为您推荐了相关专利信息

一种基于图神经网络和大模型的临床量表分类方法

文本型指标数值型指标分类方法预训练语言模型量表

样本生成方法及程序产品

大语言模型样本生成方法种子深度神经网络过滤器

一种用于智能化评估的多因果关系抽取方法及系统

评估指标体系策略生成决策建议木桶效应抽取系统

视频封面确定方法、装置、设备和存储介质

视频封面人脸视频帧生成指令对象

基于大模型的民事行政案件分析方法

案件分析方法生成法律文书自然语言线索

一种基于二次微调和集成算法的DNA甲基化位点预测方法

站点导航

APP 下载