一种基于多样特征生成的零样本汉字识别方法

正文

推荐专利

申请号：CN202410808562

申请日期：2024-06-21

公开号：CN118378621B

公开日期：2024-11-22

类型：发明专利

摘要

本发明提出一种基于多样特征生成的零样本汉字识别方法，解析汉字的部首组成获取表意描述序列；对表意描述序列进行混合语义嵌入获得多语义向量；对已见类汉字图像进行特征提取获取真实特征；构建特征生成网络学习多语义向量到真实特征的映射；通过已见类训练集进行训练后通过多种未见类语义向量生成未见类特征；利用未见类特征结合已见类训练集的特征共同训练识别模型使其具备识别已见类和未见类汉字能力。本发明通过混合语义嵌入提供多种语义来生成训练样本，有助于缓解合成特征的域迁移问题和特征混淆问题，提高特征生成的泛化能力和鲁棒性；通过为识别模型提供高质量的未见类特征，缓解零样本汉字识别的偏倚问题，提高了未见汉字的识别能力。

技术关键词

汉字识别方法语义向量生成特征训练特征训练识别模型编码器节点序列树状结构网络标签约束生成器图像生成训练样本损失函数优化参数

系统为您推荐了相关专利信息

基于医疗大模型的三高患者画像生成方法

画像生成方法语义向量自然语言文本患者大语言模型

一种可信硬件间的电子交割支付方式

可信硬件汉信码兼容IC卡身份小程序

基于人工智能的防爆设备全生命周期数字化管理系统

数字化管理系统防爆设备融合环境因素分类特征动态时间窗口

一种基于图像填充增强的图像去阴影方法和系统

图像去阴影方法图像增强模型阴影检测模型文本编码器语义向量

认知状态检测方法、模型训练方法、装置、设备和介质

组学特征训练特征影像状态检测方法模型训练方法

一种基于多样特征生成的零样本汉字识别方法

站点导航

APP 下载