摘要
本发明涉及一种基于环挤压模型中转录因子序列预测CTCF染色质环的方法。它解决了现有技术中染色质环预测方法可解释性有限且预测不准确的问题。它包括S1、构建数据集;S2、关键转录因子序列转化;S3、建立基于关键转录因子序列的CTCF染色质环分类模型;S4、模型评估。本发明的优点在于:仅用关键转录因子序列作为输入,能够实现对CTCF染色质环的预测。创新地将转录因子结合顺序编码为转录因子序列,利用自然语言的预训练BERT模型,解码转录因子序列,实现对CTCF染色质环的预测,提高预测准确率的同时,增强预测模型的可解释性。
技术关键词
转录因子
序列
建立分类模型
垃圾桶
数据
BERT模型
自然语言
样本
坐标
定义
染色体
分类器
训练集
阶段
终点
位点
解码
逻辑
标签
曲线
系统为您推荐了相关专利信息
电力系统安全防护
入侵检测模型
中心服务器
指纹
强化学习框架
水电机组调速器
调节PID参数
振荡抑制方法
偏差
模块化多电平换流器
负载设备
负荷预测模型
调控系统
可调设备
数据采集模块