多尺度文本的识别方法、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202511014224

申请日期：2025-07-22

公开号：CN120913232A

公开日期：2025-11-07

类型：发明专利

摘要

本申请实施例提供一种多尺度文本的识别方法、电子设备、存储介质及程序产品。该方法包括：获取携带待识别多尺度文本的图像信息，对图像信息进行优化处理，得到优化图像；确定优化图像中存在待识别文本的图像范围，通过预设的文字识别模型识别对图像范围内的待识别文本进行识别，得到第一识别结果，其中，文字识别模型是通过机器学习多组样本数据得到的，其中，多组样本数据中的每组数据均包括：不同风格的样本字、样本字对应的实体字，第一识别结果至少包括待识别多尺度文本的中部分文本的识别结果；对第一识别结果进行语义识别，将语义识别的识别结果确定为待识别文本识别结果。该方法用以达到准确识别多尺度文本的效果。

技术关键词

图像实体多尺度计算机执行指令文本识别语义矫正样本倾斜角度数值识别方法格式文本检测模型像素点逻辑可读存储介质数据风格处理器识别设备

系统为您推荐了相关专利信息

一种配置有视觉语言大模型的变电站巡检用机器狗及巡检方法

变电站巡检机器狗巡检路径多模态传感器多源异构数据

一种高质量图像重建方法

卷积神经网络模型图像重建方法构建卷积神经网络校正模块饱和度

一种餐饮废油管理方法及系统

餐饮废油风险评估报告管理方法身份标签

多模态大模型的训练方法及装置

桥接模块视觉特征音频特征文本音频编码器

车辆后轮的控制方法、装置、车辆及存储介质

横摆角速度路面特征车辆动力学模型车机设备计算机程序产品

多尺度文本的识别方法、电子设备、存储介质及程序产品

站点导航

APP 下载