摘要
本申请公开了一种文本分类方法及装置,涉及机器学习技术领域。该方法包括:获取待分类文本;通过特征映射层进行向量化处理,得到向量表示;通过编码器进行自注意力处理,得到输入特征;通过第一路由网络,基于输入特征,确定目标底层专家网络,并得到底层专家特征;通过第二路由网络,基于底层专家特征,确定目标顶层专家网络,并得到顶层专家特征;基于底层专家特征和顶层专家特征,生成输出特征,并通过分类层生成待分类文本与所有预设标签对应的概率分布,以确定待分类文本的文本类型。通过层级化多专家协同架构的文本分类模型提取文本的粗粒度和细粒度特征,适应多级分类场景,提高文本分类的准确度、提高文本分类模型的泛化能力。
技术关键词
文本分类模型
标签
网络
输出特征
文本分类方法
编码器
文本分类装置
多头注意力机制
细粒度特征
机器学习技术
分类场景
层级
数据
识别模块
分词