摘要
本发明公开一种基于大语言模型的多步攻击技术链路抽取方法、系统及介质,该方法包括:获取开源威胁情报;对各种格式的开源威胁情报进行数据解析和数据清洗,统一成纯文本格式;使用大语言模型对文本格式的开源威胁情报去噪,并将结果切分成单个完整的攻击过程;爬取MITRE ATT&CK数据库中对应的攻击技术数据对Bert进行微调,通过微调后的Bert,找出与攻击过程描述相关的攻击技术,然后再通过微调后的Bert,查询MITRE ATT&CK数据库,获取到对应的攻击技术描述;以相关的攻击技术为依据,通过大语言模型对攻击过程中出现的攻击技术进行排序,以结构化的方式输出。本发明能提升攻击技术链路抽取的效率和可靠性。
技术关键词
大语言模型
链路
可读存储介质
抽取系统
数据
字符
处理器
格式
滑动窗口
程序
模式
解析器
计算机
锚点
序列
语句
文本
存储器
标签
系统为您推荐了相关专利信息
智能交互方法
节点
智能交互系统
角色权限控制
网络拓扑
干旱指数构建方法
地表反射率
灾害遥感监测技术
AI算法
Copula函数
语音翻译方法
编码
人工智能模型
参数
多点信息融合