文本识别方法、装置、计算机设备、存储介质和计算机程序产品

AITNT
正文
推荐专利
文本识别方法、装置、计算机设备、存储介质和计算机程序产品
申请号:CN202510972702
申请日期:2025-07-15
公开号:CN120913221A
公开日期:2025-11-07
类型:发明专利
摘要
本申请涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待识别图像;将待识别图像输入至文本识别模型的视觉网络,提取出待识别图像的视觉特征;将视觉特征输入至文本识别模型的语言网络,通过语言网络基于视觉特征提取出语义特征;将视觉特征和语义特征输入至文本识别模型的融合网络,通过融合网络中的多个融合单元对视觉特征和语义特征进行融合处理,得到融合结果;基于融合结果,生成针对待识别图像的文本识别结果。采用本方法能够准确地识别出图像中包含的文本。
技术关键词
文本识别模型 训练样本图像 视觉特征提取 网络 文本识别方法 字符 计算机程序产品 掩码矩阵 计算机设备 文本识别装置 语义特征提取 图像块特征 图像获取模块 序列
系统为您推荐了相关专利信息
1
一种基于张量补全的移动网络协同定位方法
协同定位方法 移动网络 噪声 表达式 正则化参数
2
一种通信网络通信故障定位监测方法
定位监测方法 网络通信故障 网络拓扑模型 定位故障源 显示网络状态
3
一种考虑电力消耗的通信网络优化方法、装置及设备
通信网络优化方法 综合评估模型 节点 电力通信方法 网元设备
4
一种基于神经网络拟合的短光纤延时自外差线宽测量系统及方法
光纤延时 平衡光电探测器 声光调制器驱动器 光纤分束器 线宽测量方法
5
一种电子商务交易行为风险管理方法及存储介质
风险管理方法 多模态生物识别技术 分布式账本技术 量子随机数生成器 生物特征数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号