摘要
本申请涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待识别图像;将待识别图像输入至文本识别模型的视觉网络,提取出待识别图像的视觉特征;将视觉特征输入至文本识别模型的语言网络,通过语言网络基于视觉特征提取出语义特征;将视觉特征和语义特征输入至文本识别模型的融合网络,通过融合网络中的多个融合单元对视觉特征和语义特征进行融合处理,得到融合结果;基于融合结果,生成针对待识别图像的文本识别结果。采用本方法能够准确地识别出图像中包含的文本。
技术关键词
文本识别模型
训练样本图像
视觉特征提取
网络
文本识别方法
字符
计算机程序产品
掩码矩阵
计算机设备
文本识别装置
语义特征提取
图像块特征
图像获取模块
序列
系统为您推荐了相关专利信息
定位监测方法
网络通信故障
网络拓扑模型
定位故障源
显示网络状态
通信网络优化方法
综合评估模型
节点
电力通信方法
网元设备
光纤延时
平衡光电探测器
声光调制器驱动器
光纤分束器
线宽测量方法
风险管理方法
多模态生物识别技术
分布式账本技术
量子随机数生成器
生物特征数据