一种用于采销系统的多模态OCR系统及方法

正文

推荐专利

申请号：CN202510823767

申请日期：2025-06-19

公开号：CN120747987A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及多模态OCR技术领域，具体为一种用于采销系统的多模态OCR系统及方法，包括：图像采集模块，多模态特征提取模块，数据融合模块，识别与分析模块，反馈与优化模块；有益效果为：通过构建一种用于采销系统的多模态OCR系统，实现文本识别，其技术领域具有交叉性和综合性，广泛应用于企业生产中，极大提高办公自动化。多模态OCR涉及对图像中文本的检测、定位和识别，通过计算机视觉技术处理图像信息，利用模式识别算法提取文本特征，属于该领域的重要应用。该技术学习多模态数据与文本之间的映射关系，需要对识别出的文本进行语义理解和分析，以提高识别准确率和处理复杂文本场景。

技术关键词

OCR系统视觉特征提取语义特征提取子模块布局特征多模态高分辨率摄像头迁移学习技术特征提取模块神经网络架构图像采集模块纸质文档布局结构分析模块模式识别算法提升系统计算机视觉技术

系统为您推荐了相关专利信息

矩阵式负载的自适应调节方法、系统、设备及存储介质

排列算法数据传感消息电阻器件

一种基于云端AI控制的穿戴神经调控方法及系统

神经调控方法调控设备神经调控系统人工智能模型云端服务器

一种融合设计规则与视觉注意力机制的艺术素材美学评价方法与系统

视觉注意力机制评价方法视觉特征提取多任务联合训练局部视觉特征

一种播放器皮肤的生成方法、设备及存储介质

生成方法播放器视觉图像识别模型元素

基于多模态选择状态空间融合的智能合约漏洞检测方法

嵌入特征卷积特征文本多模态交互特征

一种用于采销系统的多模态OCR系统及方法

站点导航

APP 下载