摘要
本发明公开了一种基于大语言模型的多特征融合二进制代码相似性检测方法,属于信息安全技术领域。相比以往仅依赖单一特征的检测方法,本方法利用经过提示词工程微调过的大语言模型和GraphCNN图卷积神经网络能够双向捕捉函数的细微语法和全局结构信息,从而大幅提升特征表达的全面性和精确性;同时应用分层可导航小世界(Hierarchical Navigable Small World Graphs,HNSW)算法在离线向量库中高效检索候选相似函数,适合大规模数据库应用;最后通过Siamese网络的精细比对,从而在低成本条件下实现更高准确率的相似性检测。该方法通过语义与结构信息的多维融合,显著提高了相似性检测的准确性和效率,为二进制代码相似性检测提供了一种低成本基础上更准确、鲁棒的解决方案。
技术关键词
二进制代码相似性检测方法
Siamese网络
大语言模型
多层感知器
语义特征
节点
全局结构信息
邻居
后续数据处理
离线
精确地识别
信息安全技术
随机梯度下降
语法特征
启发式算法
融合策略
样本
代表
系统为您推荐了相关专利信息
机器翻译方法
语义向量
词嵌入向量
动态映射机制
语义特征提取
高分遥感影像
建筑物
邻域特征
上下文特征
分类方法
语义特征
信息检索
评估设备
计算机程序产品
评估装置