摘要
本发明公开了一种军事文档信息提取与知识图谱构建方法及系统,其中所述方法包括:获取军事文档PDF文件,根据文本布局特征划分文本区域,生成候选文本区域集合。针对候选文本区域集合,采用术语匹配算法与军事术语知识库进行匹配,筛选出真实文本区域。针对非文本区域,根据符号形状特征进行形状分析,生成候选符号注释区域集合。针对候选符号注释区域集合,采用模式识别算法与军事符号知识库进行匹配,筛选出真实符号注释区域。本发明能够准确识别并关联文本与符号注释,纠正识别结果,生成结构化的军事要素描述数据,并构建军事要素知识图谱,从而提高了军事文档信息处理的准确性和效率。
技术关键词
知识图谱构建方法
符号
军事
模式识别算法
布局特征
建立映射关系
术语
文本识别
知识图谱构建系统
空间关系推理
构建知识图谱
特征提取算法
颜色
复杂度
规则算法
合并算法
系统为您推荐了相关专利信息
根土复合体
数值模拟方法
路基边坡
简化植物
边坡模型
图像识别模型
索引
码表
神经网络训练算法
神经网络技术
服务系统
数据采集模块
特征工程
特征选择
层次分析法
导频符号
OFDM符号
估计补偿方法
信号
补偿值