基于AI的文字位置和内容识别方法

AITNT
正文
推荐专利
基于AI的文字位置和内容识别方法
申请号:CN202411490258
申请日期:2024-10-24
公开号:CN119445589B
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开了基于AI的文字位置和内容识别方法,涉及文字识别技术领域,本方法通过双向LSTM模型从多尺度融合特征中提取序列特征,结合上下文信息进行聚合,并引入注意力机制,输出上下文特征。通过连接时序分类CTC算法对上下文特征进行字符预测,输出预测概率,并结合语言模型LM对预测结果进行解码,获取解码文字序列。进一步地,通过自适应修正模型对解码结果进行修正,输出最终的识别结果。将各个步骤的结果进行汇总,并通过综合评估系数Sfinal对识别结果进行智能化决策和反馈调整,此一系列优化措施使得系统能够动态适应不同的输入条件,不仅提升了识别精度,还提高了系统的自适应性和鲁棒性。
技术关键词
内容识别方法 上下文特征 序列特征 空间变换网络 融合特征 引入注意力机制 图片 解码 CTC算法 字符 LSTM模型 文本检测技术 图像校正 多尺度特征融合
系统为您推荐了相关专利信息
1
基于图像-文本匹配的超声图像质量评估方法及装置
图像 文本 融合特征 图文 带标签
2
电生理及血液动力学多模态智能可穿戴系统及数据评估方法
智能可穿戴系统 电信号 模组 多模态数据融合 数据评估方法
3
基于频域注意力扩散模型的单域泛化旋转机械故障诊断方法
故障诊断模型 融合特征 频域特征 注意力机制 时域混合特征
4
一种基于多模态数据的数字孪生系统及构建方法
数字孪生系统 活动推荐系统 出行技术 交互系统设计 仿真环境
5
增强元学习的购买意向预测方法、模型训练方法及设备
多层感知器 购买意向预测方法 预测特征 决策树模型 基础
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号