摘要
本发明公开了一种中文文本中词语的分类方法、装置、设备及存储介质,该方法包括:获取待识别的中文文本;分别提取所述中文文本的字词特征、汉字结构分解特征、汉字象形特征和汉字拼音特征;将所述字词特征、所述汉字结构分解特征、所述汉字象形特征和所述汉字拼音特征输入至预训练的基于自注意力机制的神经网络模型中,输出所述中文文本中词语的分类结果;其中,所述基于自注意力机制的神经网络的训练数据集为标注了词语的词义类型的中文文本数据;所述分类结果为所述词语的所述词义类型。利用该方法:对中文汉字的多元信息进行抽取,从不同方面描述中文汉字的特征,然后对提取的多元特征进行融合,提升识别的性能。
技术关键词
中文文本
分解特征
汉字结构
注意力机制
拼音
词语
字词
一维卷积神经网络
神经网络模型
分类方法
卷积神经网络提取
融合特征
输出模块
处理器
可读存储介质
特征提取模块
图像
数据获取模块
系统为您推荐了相关专利信息
风力机叶片
支持向量机分类器
信号
叶片状态监测
小波分析方法
空间金字塔池化
多尺度特征融合
特征提取模块
关键点
建筑
语音识别方法
语音特征
注意力机制
语音识别模型
计算机可执行指令
遥感高光谱图像
高光谱图像数据
卷积模型
卷积模块
标记