一种基于大语言模型的多特征融合二进制代码相似性检测方法

正文

推荐专利

申请号：CN202510369219

申请日期：2025-03-27

公开号：CN120295607A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种基于大语言模型的多特征融合二进制代码相似性检测方法，属于信息安全技术领域。相比以往仅依赖单一特征的检测方法，本方法利用经过提示词工程微调过的大语言模型和GraphCNN图卷积神经网络能够双向捕捉函数的细微语法和全局结构信息，从而大幅提升特征表达的全面性和精确性；同时应用分层可导航小世界(Hierarchical Navigable Small World Graphs，HNSW)算法在离线向量库中高效检索候选相似函数，适合大规模数据库应用；最后通过Siamese网络的精细比对，从而在低成本条件下实现更高准确率的相似性检测。该方法通过语义与结构信息的多维融合，显著提高了相似性检测的准确性和效率，为二进制代码相似性检测提供了一种低成本基础上更准确、鲁棒的解决方案。

技术关键词

二进制代码相似性检测方法 Siamese网络大语言模型多层感知器语义特征节点全局结构信息邻居后续数据处理离线精确地识别信息安全技术随机梯度下降语法特征启发式算法融合策略样本代表

系统为您推荐了相关专利信息

城市碳排放数据的空间实体对齐方法

实体对齐方法排放量提问方法数据度计算方法

一种基于深度学习的多语言机器翻译方法

机器翻译方法语义向量词嵌入向量动态映射机制语义特征提取

一种基于多跳图神经网络的高分遥感影像建筑物功能类型分类方法

高分遥感影像建筑物邻域特征上下文特征分类方法

一种面向零样本的跨领域推荐方法和系统

物品特征层级大语言模型推荐方法概念

技术方案评估方法、装置、设备、存储介质及产品

语义特征信息检索评估设备计算机程序产品评估装置

一种基于大语言模型的多特征融合二进制代码相似性检测方法

站点导航

APP 下载