一种文档识别方法、装置、设备及介质

AITNT
正文
推荐专利
一种文档识别方法、装置、设备及介质
申请号:CN202410866723
申请日期:2024-06-28
公开号:CN118799910A
公开日期:2024-10-18
类型:发明专利
摘要
本公开实施例涉及一种文档识别方法、装置、设备及介质,其中该方法包括:获取目标文档图像;提取目标文档图像中文档元素的位置和文字内容;对目标文档图像、文档元素的位置和文字内容进行特征处理,得到多模态特征;基于多模态特征进行处理得到目标文档图像对应的目标文档内容,其中,目标文档内容包括按照阅读顺序排序的文档元素对应的文字内容。本公开结合目标文档图像、文档元素的位置和文字内容进行特征处理得到的多模态特征通过阅读顺序模型可以还原文档内容,该文档内容包括按照阅读顺序排序的文档元素的文字内容,实现了利用多模态特征按照阅读顺序还原图像对应的文档,尤其涉及到复杂场景,极大提升文档识别的准确性。
技术关键词
多模态特征 文档识别方法 元素 语义特征 布局特征 图像 文档识别装置 词特征 视觉特征 解码器 文本行 电子设备 处理器 识别模块 可读存储介质 索引 指令 存储器
系统为您推荐了相关专利信息
1
将前端图表导出为PNG图片的方法及装置
图表 自定义输出 状态指示器 工作流模型 格式图像数据
2
一种基于蒙特卡洛树的自适应因果发现方法及设备
梯度提升树模型 节点 算法 蒙特卡洛树搜索 元素
3
一种鼻咽癌风险评分模型构建方法及装置
风险评分模型 鼻咽癌患者 脂蛋白 可执行程序代码 偏最小二乘回归模型
4
一种自适应web应用交互方法、系统和智能设备
交互方法 交互系统 运动特征 多模态传感器 场景上下文
5
基于DBSCAN算法的振动信号倍频序列挖掘方法、装置及设备
DBSCAN算法 序列 信号倍频 聚类 挖掘方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号