文本识别方法、装置、电子设备及存储介质

正文

推荐专利

文本识别方法、装置、电子设备及存储介质

申请号：CN202411720469

申请日期：2024-11-27

公开号：CN119763130A

公开日期：2025-04-04

类型：发明专利

摘要

本申请公开了一种文本识别方法、装置、电子设备，属于文本识别技术领域。所述方法包括：预先训练的文本识别模型的特征提取模块，对文本图像进行深层多尺度特征提取，获取多尺度图像特征；通过文本识别模型的编码器，对多尺度图像特征进行编码处理，得到编码特征；通过文本识别模型的区域选择模块，对编码特征进行文本行区域选择处理，得到文本行对应的第一查询向量；通过文本识别模型的解码器，基于第一查询向量和编码特征进行逐层解码处理，得到第二查询向量；通过文本识别模型的多个不同第一预测头，对第二查询向量进行文本相关信息预测，得到文本信息预测结果。本方法结合视觉和语义等多模态特征进行解码，提升了文本识别的准确度。

技术关键词

文本识别模型编码特征文本行文本识别方法多尺度特征提取解码器融合多模态特征语义信息提取特征提取模块掩膜图像文本识别技术信息编码

系统为您推荐了相关专利信息

基于人工智能的情绪识别方法、装置、设备及存储介质

情绪识别模型情绪识别方法视频智能穿戴设备图像编码

用于化疗引致抑郁评估的脑源性神经营养因子辅助测定系统及方法

非线性映射关系抗体复合物神经营养因子外周血检测磁场

一种基于DETR的多谱甲烷气体泄露检测方法

气体泄露检测方法甲烷高光谱图像数据细化器查询特征

一种利用双向交互网络定位图像篡改区域的方法

图像篡改区域注意力交互网络焦点损失函数模块

宏表情图像生成方法和装置、电子设备及存储介质

图像生成模型样本图像生成方法图像语义提取编码器

文本识别方法、装置、电子设备及存储介质

站点导航

APP 下载