摘要
本发明涉及基于BWA和BWA*的序列比对内存估计及参数调优方法,属于生物信息、大数据领域,该方法包括以下步骤:S1:建立内存估计的模型A、sa_interval参数选择的模型B和串并联选择的模型C;S2:获取计算终端的可用内存大小、参考序列文件大小、查询序列个数;S3:通过模型A求得sa_interval参数的取值范围;S4:选择模型B计算出sa_interval最优值;S5:利用模型C判断是否采用多线程模式计算;S6:结合sa_interval最优值和线程模式,对基于BWA或BWA*的序列比对方法的进行设定,利用设定好的方法完成序列比对。本发明能够根据查询任务和终端配置来选择最佳的sa_interval参数并判断是否适合使用多线程,防止内存不足的同时能够提高序列比对的计算速度。
技术关键词
参数调优方法
序列比对方法
多线程
内存
算法
终端
模式
大数据
变量
线性
生物
精度
速度