摘要
本发明提供一种预测脑疾病中功能性非编码拷贝数变异致病性的方法,属于生物信息学技术领域。包括:收集脑相关特征构建脑相关特征集,脑相关特征集中元素的类型包括转录因子结合位点、组蛋白修饰及染色质可及性三种;构建融合二维卷积和swin‑transformer的混合模型,用于捕获DNA序列中脑相关顺式调控元件的协同调控特性并生成N维脑相关功能特征注释,利用脑相关特征集训练混合模型;构建两个脑相关拷贝数变异数据的CNV数据集,其中,混合数据集中数据类型包含编码与非编码,高置信度非编码数据集仅包含非编码数据;基于两个CNV数据集训练随机森林模型;混合模型和随机森林模型共同组成DefunCNV模型,预测脑疾病中功能性非编码拷贝数变异的致病性。
技术关键词
随机森林模型
拷贝数
矩阵
疾病
混合型
二维卷积神经网络
训练混合模型
DNA序列
蛋白质编码基因
调控元件
生物信息学技术
数据
转录因子
染色体
训练集
随机梯度下降
元素
编码结构
系统为您推荐了相关专利信息
实时诊断方法
冲击故障
故障特征
连续小波变换
样本
业务分配方法
随机森林模型
实时数据
实时图像
时间序列特征
搜寻方法
关键点
移动机器人执行
图像分割算法
栅格地图构建