摘要
本发明公开了一种融合汉字字形、字义、字音知识的古诗主题识别方法,包括:构建古诗文本编码层,从古诗文本中提取古诗文本特征;构建汉字知识检索层,得到汉字‑注音符号映射表、汉字‑结构映射表和汉字‑部首映射表;构建汉字知识编码层,从古诗文本中提取融合有注音、结构和部首的汉字知识特征;构建识别结果输出层,将古诗文本特征和汉字知识特征拼接,输出概率最大的古诗主题识别结果。本发明聚焦于汉字的独有属性,通过融合古诗文本特征与汉字注音、汉字结构和汉字部首等多维度汉字知识特征,提出一种融合汉字字形、字义、字音知识的古诗主题识别模型,旨在提升古籍的语义理解能力和主题识别能力。
技术关键词
主题识别方法
汉字结构
Word2Vec模型
BiLSTM模型
交叉注意力机制
局部特征提取
前馈神经网络
编码
序列
参数
语义
字形结构
关系
矩阵