摘要
本发明提供了一种基因序列匹配方法、系统、计算机设备及存储介质,属于计算机领域,包括:获取待处理的DNA序列;定义主串S和子串T,确定主串S和子串T存储下标从1开始进行匹配,得到基因序列匹配结果;其中,主串S为完整的DNA序列,子串T为特定的基因片段;其中,当主串S与子串T在第p个字符和第q个字符匹配失败时,利用子串T内部结构信息,通过部分匹配表确定子串T新的比较位置。本发明在匹配失败时,利用部分匹配表(next数组)避免主串指针回溯,有效减少了冗余的字符比较操作,避免了在匹配过程中进行大量重复计算,使得整个基因序列匹配过程更加高效,大幅提升了字符串匹配效率,尤其在处理长字符串和大规模数据时优势显著。
技术关键词
序列
基因
字符
计算机设备
数据获取模块
生成算法
匹配模块
处理器
指针
定义
可读存储介质
存储器
冗余
系统为您推荐了相关专利信息
无标签样本
半监督学习
计算机程序指令
指数
参数
卷积网络模型
管控方法
节点
电力营销数据采集
传感器
交通安全预警系统
门控循环单元网络
城市交通场景
融合特征
时序依赖关系