摘要
本发明涉及自然语言处理技术领域,提供一种变体词识别方法及装置,所述方法包括:对待识别文本进行分词,得到至少一个文本分词;对各文本分词进行文本图像生成,得到各文本分词对应的分词图像;基于各文本分词的编码特征,以及对应分词图像的编码特征,得到各文本分词的变体词识别结果。本发明结合各文本分词的编码特征以及对应分词图像的编码特征,可以融合文本语义与视觉细节信息,将文本模态的文本分词和图像模态的分词图像对齐到同一语义空间,更全面地理解和识别变体词,有效提升了变体词识别的准确率。
技术关键词
变体词识别方法
分词
编码特征
图像
文本识别
预训练模型
非暂态计算机可读存储介质
样本
处理器
计算机程序产品
识别装置
自然语言
语义
存储器
标签
电子设备
视觉
系统为您推荐了相关专利信息
纹识别方法
注意力
融合特征
金字塔池化
标签类别
训练样本集
分类网络
高光谱图像分类
贪心算法
策略更新