一种文档图像的处理方法、电子设备、存储介质

正文

推荐专利

申请号：CN202510880375

申请日期：2025-06-27

公开号：CN120808374A

公开日期：2025-10-17

类型：发明专利

摘要

本申请提供一种文档图像的处理方法、电子设备、存储介质，包括：将文档图像输入已训练的统一模型，得到文档图像中每个目标区域对应的多种不同类别的识别结果；针对每个目标区域，根据目标区域对应的多种不同类别的识别结果，生成目标区域对应的提示文本；将每个目标区域的提示文本以及接收的用户问题，输入已训练的多模态模型，获得多模态模型输出的用户问题对应的文档理解结果。用以充分融合多种模态的信息，对复杂文档图像进行针对性理解，提升文档图像处理的准确性、灵活性和实用性。

技术关键词

文本识别模型残差模块文档图像处理电子设备中间件处理器多模态标签计算机程序产品图表样本可读存储介质指令存储器动态参数

系统为您推荐了相关专利信息

虚拟化资源分配方法及装置

资源使用量服务器概率密度函数生成样本数据模运算

处理方法、装置、电子设备和存储介质

识别算法指令框架处理单元日志

冷水机组模型的优化方法、设备、存储介质及产品

冷水机组数据优化方法训练样本数据预测误差随机森林

基于血管标志的淋巴结转移预测方法、装置及存储介质

血管 ROI图像转移预测方法空间框架语义分割模型

风力发电机组故障电压识别方法及系统

风力发电机组故障嵌入式系统电压云端存储系统识别方法

一种文档图像的处理方法、电子设备、存储介质

站点导航

APP 下载