基于OCR的任务处理方法、设备、介质及产品

正文

推荐专利

申请号：CN202510748638

申请日期：2025-06-06

公开号：CN120260047B

公开日期：2025-11-28

类型：发明专利

摘要

本申请实施例涉及信息技术基于OCR的任务处理方法、设备、介质及产品。方法包括：根据文档图像和视觉编码器，确定图像特征；通过连接器，将图像特征映射至解码器的文本空间；根据针对文档图像发出的文本指令，确定文本特征；根据解码器，对图像特征和所述文本特征进行融合，确定OCR的识别结果。可以至少用以解决传统OCR框架中各个模块相对独立，模块之间因衔接和误差累积带来的准确性降低，以及处理多种复杂任务时泛化能力不足的技术问题。

技术关键词

文本解码器局部注意力机制多模态计算机程序指令视觉图像计算机程序产品处理器电子设备参数介质格式模块存储器线性场景

基于OCR的任务处理方法、设备、介质及产品

站点导航

APP 下载