摘要
本发明涉及一种基于领域知识迁移对抗的多元信息抽取方法,属于网络安全领域,本发明利用领域迁移技术将长文本分类模型迁移到短文本场景中,实现短文本主题精准分类并筛选威胁情报,随后,利用对抗学习机制,在现有多语言嵌入模型的基础上消除不同语言的特异性,对语言语义进行更准确的嵌入,使得多语言嵌入模型专注于语言在认知空间的一致性,并在此基础上构建跨语言信息抽取模型。对比现有技术,本发明能够实现从多种语言的碎片化的短文本威胁情报中抽取威胁实体,实现对攻击情报的精准定位。
技术关键词
信息抽取模型
信息抽取方法
网络威胁情报
词嵌入模型
多语言
数据
关键词
特征提取器
参数更新方法
论坛
标签
文本分类模型
训练集
分类器参数
实体
爬虫爬取
独立特征
系统为您推荐了相关专利信息
推荐系统
物品偏好分析
元素
词嵌入模型
分析模块
文本检索方法
文本关键信息
文本检索系统
信息抽取模型
信息检索技术
智能生成系统
覆盖率
信息抽取方法
烟草管理技术
深度学习算法