一种基于部首表示学习的零样本汉字识别方法

正文

推荐专利

申请号：CN202411694627

申请日期：2024-11-25

公开号：CN119625760A

公开日期：2025-03-14

类型：发明专利

摘要

本发明提出一种基于部首表示学习的零样本汉字识别方法，包括以下步骤：建立零样本汉字识别数据集，获取汉字的表意描述序列；根据表意描述序列获取所有汉字的语义嵌入向量和所有部首及结构嵌入向量；汉字图像经过ResNet提取图像特征向量；图像特征向量经过特征增强编码模块得到增强特征；部首表示解码模块在部首及结构嵌入向量的引导下将增强特征转化为部首表示特征；汉字匹配模块利用部首表示特征和部首及结构嵌入向量预测语义嵌入向量，并与所有语义向量进行匹配以识别汉字。本发明通过减轻图像区域几何特征的纠缠问题，来提高图像特征向语义特征的可转移性，并利用部首嵌入学习和定位汉字图像中的关键部首表示，有效的提高未见汉字的识别能力。

技术关键词

汉字识别方法图像深度特征解码模块编码模块网格样本匹配模块 Word2Vec模型图像特征向量超参数语义向量 ResNet网络序列多头注意力机制二叉树结构生成汉字

一种基于部首表示学习的零样本汉字识别方法

站点导航

APP 下载