一种文档信息提取方法及设备

AITNT
正文
推荐专利
一种文档信息提取方法及设备
申请号:CN202411925007
申请日期:2024-12-25
公开号:CN119851290A
公开日期:2025-04-18
类型:发明专利
摘要
本申请提出了一种创新的解决方案,在原有OCR文本框检测、文字识别提取的二阶方法之上,扩展图片文档分版面内信息的关系逻辑识别提取的高阶处理能力,能够充分利用文档的视觉特征和语义特征,在较少样本的情况下训练出效果很好的模型,且具备较强的泛化能力,从而快速满足企业中复杂版面文档信息抽取的需求。
技术关键词
文本 文档结构化信息 排版 信息提取方法 图像语义分割 表格 切片 样本 语义特征 线框 编码器 参数 视觉特征 算法 线条 计算机设备 关系 存储器 滤波 处理器
系统为您推荐了相关专利信息
1
运维信息反馈方法、装置、电子设备及存储介质
运维 信息反馈方法 语音输入信息 多模态 信息检索
2
基于多模态大模型的癌症患者VTE风险预测与防治系统
防治系统 多模态 模型压缩 表达式 风险预测模型
3
基于文本片段表征学习的地名识别方法、装置及设备
文本 实体 地名识别方法 语义 编码器
4
基于线上调解信息数据的法律文书生成方法及系统
法律文书生成方法 语句 三元组 生成法律文书 指数
5
基于大语言模型的文档图像信息抽取方法和装置
图像信息抽取方法 大语言模型 文本行 坐标位置信息 答案
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号