一种基于二次微调和集成算法的DNA甲基化位点预测方法

AITNT
正文
推荐专利
一种基于二次微调和集成算法的DNA甲基化位点预测方法
申请号:CN202411482977
申请日期:2024-10-23
公开号:CN119380811B
公开日期:2025-09-09
类型:发明专利
摘要
本发明公开了一种基于二次微调和集成算法的DNA甲基化位点预测方法,属于生物信息学技术领域。本发明将UCSC数据库中获得的人类DNA启动子序列经过1‑mer、3‑mer和5‑mer分词后作为语料库对BERT模型进行预训练,形成Promoter‑BERT模型,实现了对DNA启动子序列中深层特征的捕获和抽象,为后续的微调提供了高效且稳健的初始状态;利用3种甲基化的最大的三个数据集对Promoter‑BERT模型进行第一次微调,并利用数据量较小的14个数据集进行了模型的第二次微调,可以使模型更加专注于学习该数据集特有的特征,从而更好地适应特定任务,这有助于模型在目标任务上获得更高的准确性和性能,减少过拟合的风险。
技术关键词
BERT模型 位点预测方法 集成算法 启动子 分词 序列 生物信息学技术 数据 模型预训练 预训练模型 参数 策略 人类 标记 风险 周期 基础
系统为您推荐了相关专利信息
1
一种基于图神经网络和大模型的临床量表分类方法
文本型指标 数值型指标 分类方法 预训练语言模型 量表
2
样本生成方法及程序产品
大语言模型 样本生成方法 种子 深度神经网络 过滤器
3
一种用于智能化评估的多因果关系抽取方法及系统
评估指标体系 策略 生成决策建议 木桶效应 抽取系统
4
视频封面确定方法、装置、设备和存储介质
视频封面 人脸 视频帧 生成指令 对象
5
基于大模型的民事行政案件分析方法
案件 分析方法 生成法律文书 自然语言 线索
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号