摘要
本申请公开了一种跨语言网络安全实体识别与对齐方法及系统,属于自然语言处理与网络安全交叉技术领域。方法包括:接收多源漏洞文本;将多源漏洞文本输入到实体识别模型中,得到实体识别模型输出的漏洞实体集合;实体识别模型采用混合神经网络架构,混合神经网络架构包括预训练语言模型、卷积神经网络、条件随机场和双向长短记忆网络。本申请采用包括预训练语言模型、卷积神经网络、条件随机场和双向长短记忆网络的混合神经网络架构,结合了领域自适应预训练策略,以及基于语义相似度和聚类融合的实体对齐算法,增强了多语言混合文本的处理能力,减少跨语言场景下的实体边界模糊的问题,提高跨语言场景下漏洞识别的准确性。
技术关键词
漏洞
实体识别模型
神经网络架构
预训练语言模型
网络安全实体
长短记忆网络
条件随机场
文本
网络安全交叉技术
对齐方法
非暂态计算机可读存储介质
语义特征
对齐系统
对齐模块
处理器
分词
自然语言
机制
系统为您推荐了相关专利信息
执法记录仪
语义检索系统
语义检索方法
语音适配器
音频
预训练语言模型
运维工具
故障修复方法
日志
云平台故障
光学动作捕捉
手势区域
手势识别设备
手势边缘图像
热成像设备
预训练语言模型
计算机可读指令
列表
意图识别模型
年龄