基于AI的文字位置和内容识别方法

正文

推荐专利

基于AI的文字位置和内容识别方法

申请号：CN202411490258

申请日期：2024-10-24

公开号：CN119445589B

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了基于AI的文字位置和内容识别方法，涉及文字识别技术领域，本方法通过双向LSTM模型从多尺度融合特征中提取序列特征，结合上下文信息进行聚合，并引入注意力机制，输出上下文特征。通过连接时序分类CTC算法对上下文特征进行字符预测，输出预测概率，并结合语言模型LM对预测结果进行解码，获取解码文字序列。进一步地，通过自适应修正模型对解码结果进行修正，输出最终的识别结果。将各个步骤的结果进行汇总，并通过综合评估系数Sfinal对识别结果进行智能化决策和反馈调整，此一系列优化措施使得系统能够动态适应不同的输入条件，不仅提升了识别精度，还提高了系统的自适应性和鲁棒性。

技术关键词

内容识别方法上下文特征序列特征空间变换网络融合特征引入注意力机制图片解码 CTC算法字符 LSTM模型文本检测技术图像校正多尺度特征融合

系统为您推荐了相关专利信息

基于图像-文本匹配的超声图像质量评估方法及装置

图像文本融合特征图文带标签

电生理及血液动力学多模态智能可穿戴系统及数据评估方法

智能可穿戴系统电信号模组多模态数据融合数据评估方法

基于频域注意力扩散模型的单域泛化旋转机械故障诊断方法

故障诊断模型融合特征频域特征注意力机制时域混合特征

一种基于多模态数据的数字孪生系统及构建方法

数字孪生系统活动推荐系统出行技术交互系统设计仿真环境

增强元学习的购买意向预测方法、模型训练方法及设备

多层感知器购买意向预测方法预测特征决策树模型基础

基于AI的文字位置和内容识别方法

站点导航

APP 下载