摘要
本发明涉及一种基于混合视觉策略的异构表格抽取方法,属于人工智能、大数据、计算机视觉、自然语言处理技术领域。本发明通过改进现有的表格解析技术,并结合深度学习和自然语言处理技术,提升表格数据的识别准确率与提取效率,为构建高质量的军事知识库奠定基础。本发明改善了当前表格数据识别中的技术瓶颈,也为未来军事情报分析和自动化决策系统提供了数据支持。
技术关键词
Attention机制
表格抽取方法
表格区域识别
感知损失函数
合并单元格
卷积递归神经网络
条件随机场
像素
数据
文本区域检测
序列特征
表头
线条
时序依赖关系
语义
二值化算法