多尺度文本的识别方法、电子设备、存储介质及程序产品

AITNT
正文
推荐专利
多尺度文本的识别方法、电子设备、存储介质及程序产品
申请号:CN202511014224
申请日期:2025-07-22
公开号:CN120913232A
公开日期:2025-11-07
类型:发明专利
摘要
本申请实施例提供一种多尺度文本的识别方法、电子设备、存储介质及程序产品。该方法包括:获取携带待识别多尺度文本的图像信息,对图像信息进行优化处理,得到优化图像;确定优化图像中存在待识别文本的图像范围,通过预设的文字识别模型识别对图像范围内的待识别文本进行识别,得到第一识别结果,其中,文字识别模型是通过机器学习多组样本数据得到的,其中,多组样本数据中的每组数据均包括:不同风格的样本字、样本字对应的实体字,第一识别结果至少包括待识别多尺度文本的中部分文本的识别结果;对第一识别结果进行语义识别,将语义识别的识别结果确定为待识别文本识别结果。该方法用以达到准确识别多尺度文本的效果。
技术关键词
图像 实体 多尺度 计算机执行指令 文本识别 语义 矫正 样本 倾斜角度数值 识别方法 格式 文本检测模型 像素点 逻辑 可读存储介质 数据 风格 处理器 识别设备
系统为您推荐了相关专利信息
1
一种配置有视觉语言大模型的变电站巡检用机器狗及巡检方法
变电站巡检 机器狗 巡检路径 多模态传感器 多源异构数据
2
一种高质量图像重建方法
卷积神经网络模型 图像重建方法 构建卷积神经网络 校正模块 饱和度
3
一种餐饮废油管理方法及系统
餐饮废油 风险评估报告 管理方法 身份 标签
4
多模态大模型的训练方法及装置
桥接模块 视觉特征 音频特征 文本 音频编码器
5
车辆后轮的控制方法、装置、车辆及存储介质
横摆角速度 路面特征 车辆动力学模型 车机设备 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号