一种原文要素识别方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411073265

申请日期：2024-08-06

公开号：CN118587724A

公开日期：2024-09-03

类型：发明专利

摘要

本发明一种原文要素识别方法、系统、设备及存储介质。原文要素识别方法包括：将原文件输入到预先训练好的OCR模型中，获得图像信息和文本序列，OCR模型通过多种格式的文件数据训练得到；将图像信息和文本序列输入到预先训练好的KIE模型中，获得图像特征向量和文本特征向量；对图像特征向量和文本特征向量通过注意力加权克罗内克积进行融合，获得加权后的双特征向量矩阵；将加权后的双特征向量矩阵输入到图推理网络，获得节点特征；对节点特征按预先设定的字段类别进行分类。本发明通过图像特征向量和文本特征向量通过加权的克罗内克积进行融合而获得的节点特征提高了对原文要素识别的准确度。

技术关键词

文本特征向量图像特征向量节点特征计算机可执行指令识别方法注意力推理网络序列矩阵处理器可读存储介质电子设备格式识别系统模块存储器数据

系统为您推荐了相关专利信息

多用户直播联机游戏处理方法、系统、设备及存储介质

游戏媒体客户端流媒体服务器多用户信令

基于人工智能的铁路设施识别方法、装置及可读存储介质

高分辨率遥感影像识别方法图像特征金字塔网络设施

一种基于OpenCV的网格布包裹机视觉识别方法及系统

EPS线条二值化图像视觉识别方法坐标系包裹机

一种基于复杂场景图像识别的驱鸟智能控制系统

驱鸟智能控制系统指数智能控制方法检测点

一种基于AI的微服务系统异常处理方法、系统及存储介质

服务系统 Kubernetes容器异常信息代码仓库分析模块

一种原文要素识别方法、系统、设备及存储介质

站点导航

APP 下载