摘要
本发明公开了基于深度学习的细粒度字形匹配网络的汉字字形匹配方法及系统,方法如下:S1、获取含有微调水印的汉字图像,利用OCR技术进行图像预处理;S2、基于汉字类别信息,采用分层随机抽样策略构建支持集和目标集;S3、将步骤S2得到的支持集和目标集图像输入卷积神经网络中,提取字形嵌入特征向量;S4、构建支持集与目标集之间的标签掩码矩阵;S5、在特征空间中计算支持样本与目标样本之间的相似度矩阵;S6、基于标签掩码与相似度矩阵,构建并优化结合正负样本的层次距离损失函数,配合交叉熵损失进行卷积神经网络训练;S7、将训练好的网络用于待提取水印的图像中进行水印提取,通过支持集匹配结果输出目标图像对应的字形类别或水印位置信息。
技术关键词
汉字
分层随机抽样
样本
匹配网络
卷积神经网络训练
水印
掩码矩阵
图像
标签
策略
超参数
线性单元
网络结构
输出模块
组织
尺寸
定义