摘要
本申请提出了一种创新的解决方案,在原有OCR文本框检测、文字识别提取的二阶方法之上,扩展图片文档分版面内信息的关系逻辑识别提取的高阶处理能力,能够充分利用文档的视觉特征和语义特征,在较少样本的情况下训练出效果很好的模型,且具备较强的泛化能力,从而快速满足企业中复杂版面文档信息抽取的需求。
技术关键词
文本
文档结构化信息
排版
信息提取方法
图像语义分割
表格
切片
样本
语义特征
线框
编码器
参数
视觉特征
算法
线条
计算机设备
关系
存储器
滤波
处理器
系统为您推荐了相关专利信息
运维
信息反馈方法
语音输入信息
多模态
信息检索
法律文书生成方法
语句
三元组
生成法律文书
指数
图像信息抽取方法
大语言模型
文本行
坐标位置信息
答案