摘要
本申请公开了一种医学基因测序数据的模式识别方法及设备,属于数据处理技术领域,所述方法包括:对测序获得的目标基因序列进行预处理,构建自适应打分矩阵,利用神经网络训练对位点得分进行动态调整;利用自适应打分矩阵,采用滑动窗口扫描序列差异并结合高斯混合模型分析,生成变异区域信息文件;读取变异区域信息文件,构建碱基转换矩阵进行序列比对,通过分析比对路径生成变异分类结果;基于变异分类结果对变异区域特征向量进行标准化处理,通过改进的聚类算法生成突变模式类型。通过本申请的方案,能够提高序列数据过滤质量,增强处理复杂变异模式的能力。
技术关键词
基因测序数据
模式识别方法
高斯混合模型
位点
信息熵
滑动窗口
矩阵
医学
神经网络训练
模式识别设备
序列比对算法
数值
动态规划算法
频率
初始聚类中心
核苷酸