摘要
本发明提供一种面向siRNA脱靶分析的快速序列比对与注释方法,解决传统方法因生成错配变异序列导致的组合爆炸问题。包括如下步骤,对目标物种cDNA序列进行滑动窗口截取,按小干扰脱氧核糖核酸siRNA长度L以步长1碱基滑动截取片段;将每个片段及小干扰脱氧核糖核酸siRNA序列中的碱基映射为2bit二进制码,转换为包含2L有效bit的64位整数存储;执行小干扰脱氧核糖核酸siRNA编码值S与互补脱氧核糖核酸cDNA窗口编码值C的按位异或操作;将执行结果R的每相邻2bit进行逻辑或操作,压缩为L bit结果B;计算B的汉明权重,作为错配数;对满足预设错配阈值的匹配片段,从MySQL数据库通过GeneID关联并输出基因表达注释信息。该方法的优点在于,规避了组合爆炸,提升了运行效率,优化了资源配置。
技术关键词
脱氧核糖核酸
注释方法
序列
滑动窗口
多线程并行处理
编码
基因
逻辑
数据
算法
系统为您推荐了相关专利信息
性能智能检测方法
电子设备性能检测技术
触点
键盘
物理
任务调度方法
计算机执行指令
任务调度设备
任务调度装置
粒子群优化算法