摘要
本发明涉及基于字形与语义对比学习的多阶段表意文字图像分类方法,涉及表意文字识别技术领域,包括:将原始文字图像,输入结构化识别网络中,提取输入图像的字形特征;其中,结构化识别模型,基于对卷积神经网络模型训练获得;对原始文字图像进行标签编码;利用视觉语义编码网络提取原始文字图像的图像特征,并将图像特征与标签编码进行映射对齐,获取输入图像的语义特征;其中,视觉语义编码网络,基于对卷积神经网络模型训练获得;将字形特征和语义特征进行融合,整合字形和语义信息,获取文字分类结果。本发明针对汉字字形复杂性和长尾分布的挑战,核心通过混淆社区对比学习与语义特征对齐实现技术突破,显著提升了模型的识别性能。
技术关键词
图像分类方法
表意文字
卷积神经网络模型
字形特征
语义特征
样本
标签
阶段
编码
挖掘算法
训练集
字符
视觉特征
文本
节点
像素
系统为您推荐了相关专利信息
核查系统
语义特征
特征金字塔网络
图像特征提取
矩阵
统计特征
长短期记忆模型
加密流量分类方法
语义特征
卷积神经网络模型
面向工业设备
对话交互方法
语音
意图分类模型
滤波算法