摘要
本发明提供了一种文本分级方法及系统,所述方法包括获取待分级文本,并对所述文本进行预处理,通过多条相互独立的特征提取路径,并行提取预处理后的所述文本的异构特征向量,所述异构特征向量包括语义特征向量、语言基础特征向量、以及教育和认知特征向量;将所述语义特征向量输入门控网络,输出三类门控权重值;将所述语义特征向量、所述语言基础特征向量和所述教育及认知特征向量分别输入各自对应的独立全连接层进行维度对齐处理,得到维度对齐后的各特征向量;基于所述门控权重值,对维度对齐后的所述各特征向量进行加权融合,生成融合特征向量;将所述融合特征向量输入分类器,输出文本分级结果,避免单一特征维度的局限性。
技术关键词
文本
知识点
语义
训练语言模型
BERT模型
生字词
Softmax函数
异构
分类器
指标
词语
基础
覆盖率
分级系统
列表
大语言模型
对齐模块
核心
处理器
网络
系统为您推荐了相关专利信息
群体决策方法
面向人机
融合特征
分布式训练
编码器
智能助理机器人
人机交互方法
卡片
更新消息
计算机程序代码
时间预测方法
问答语料
多模态
特征工程
生成特征
多源异构数据
GPS轨迹数据
栅格
索引表
融合方法