摘要
本发明实施例公开的基于大模型机理的恶意代码分析方法、系统、电子设备及存储介质,涉及恶意代码分析领域。可以对海量代码进行高效分析,从而便于辅助快速识别恶意代码。所述方法包括:对二进制文件、文本或代码段进行特征提取,得到所述二进制文件、情报文本或代码段的功能、属性、行为和实体特征;将得到的所述功能、属性、行为和实体特征分别转换为特征向量;将所述特征向量输入到全代码基因分析模型中,根据已经学习的知识分析所述特征向量,识别出潜在的恶意代码;所述全代码基因分析模型是基于结构化、半结构化、非结构化网络安全数据构建的网络安全语料库和全代码库知识训练学习得到的大模型。
技术关键词
恶意代码分析方法
预训练模型
网络安全数据
代码库
多语言
恶意代码分析系统
基因
命名实体识别技术
样本
文本
保证数据一致性
网络安全分析
反汇编技术
可执行程序代码
标签
自然语言
多任务
系统为您推荐了相关专利信息
消歧方法
语义特征
嵌入特征
预训练模型
中文分词
系统日志
检测告警方法
深度学习模型
预训练模型
序列
信号解码方法
视觉诱发脑
语义特征
多模态
重建高分辨率图像
情绪识别系统
多模态
人工智能模型
生成警报信号
语音