摘要
本发明公开了嵌入科技文本语义特征编码的两阶段分类方法及系统,涉及自然语言处理技术领域,该方法包括:提取局部和全局主题特征构建主题语义特征,基于词项依存关系进行分层聚合构建结构语义特征;将二者嵌入LLMs编码层,生成融合特征序列;通过解码器提取分类特征并进行二分类判断,得到价值句序列;构建类别特征模板并计算子类语义特征;通过语义感知路由机制和混合专家模型进行多分类。本发明解决了现有文本分类无法充分利用深层语义信息,导致分类精度不足,且在类别不平衡和细粒度分类中表现不佳的技术问题,达到了通过引入双重语义特征编码和混合专家模型,显著提升分类精度,以及类别不平衡和细粒度分类能力的技术效果。
技术关键词
语义特征
主题语义
特征模板
文本
分类方法
主题特征
序列
分层特征
融合特征
编码
阶段
细粒度分类
科技
滑动窗口
解码器
机制
前馈神经网络
注意力
系统为您推荐了相关专利信息
数据分类模型
噪声数据
文本
数据筛选方法
噪声样本
中文文本
融合注意力机制
三元组
实体关系抽取
深度编码
字幕识别方法
识别模块
定位文本位置
二次识别方法
消息