摘要
本发明属于基因数据处理领域,提供了一种基于动态分词和词嵌入的染色质相互作用预测方法与系统。其中,该方法包括获取数据样本的DNA序列信息,根据设定词汇表大小对所述DNA序列信息进行动态分词处理,再根据单词的长度和出现频率,得到两条标记化子序列;将数据样本的全部标记化子序列经过嵌入层转化为DNA序列特征;将数据样本的已知基因组特征与所述DNA序列特征进行两者融合,生成联合特征;基于联合特征与集成学习模型中的各个子模型的染色质相互作用预测结果之间的关系,得到各个子模型的染色质相互作用预测结果并取平均,得到最终的染色质相互作用预测结果。
技术关键词
染色质相互作用
DNA序列特征
集成学习模型
分词
样本
动态
标记
注意力
代表
全局平均池化
数据
处理器
特征提取模块
计算机程序产品
表达式
预测系统
系统为您推荐了相关专利信息
动静态特征
电池运行状态
电池筛选方法
图像分类模型
曲线
缺陷检测方法
钢铁
缺陷类别
输入解码器
自动化缺陷检测
翻译模型
适配器技术
语言翻译系统
指令
机器翻译技术
最佳滤波器
滤波器系数
隐性特征
误差麦克风
注意力