摘要
本发明涉及一种基于文本的软件源代码块指纹生成方法,属于软件代码重用检测技术领域。本发明通过代码预处理,消除了代码重用过程中增加或删除注释、空格、制表符、回车、换行代码等修改代码方式对代码重用检测的影响,提高了提高代码重用检测的检出率;通过设置代码块字符数阈值过滤小代码块,降低小代码块对代码重用检测的影响,提高了代码块重用检测的准确性;本发明通过设置代码块哈希窗口,从中选择字符数最多代码块的哈希值作为最终代码块指纹,缩小了代码块指纹集合规模,减少了代码块重用检测过程中的检索比对工作量,提高了代码块重用检测效率。
技术关键词
字符
指纹生成方法
软件
哈希算法
对源代码
文本
分块
变量
工作量
基础
规模
代表
对象
系统为您推荐了相关专利信息
语义功能
软件开发工具包
车载终端
计算机程序指令
语音提示信息
循环优化方法
烟气
Fluent软件
速率
在线监测数据
气流磨
数值模拟方法
两相流
数据传递方法
耦合算法
并联控制系统
中央控制器
并联控制方法
IEEE1588v2协议
多端口