嵌入科技文本语义特征编码的两阶段分类方法及系统

正文

推荐专利

申请号：CN202510973914

申请日期：2025-07-15

公开号：CN120873193A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了嵌入科技文本语义特征编码的两阶段分类方法及系统，涉及自然语言处理技术领域，该方法包括：提取局部和全局主题特征构建主题语义特征，基于词项依存关系进行分层聚合构建结构语义特征；将二者嵌入LLMs编码层，生成融合特征序列；通过解码器提取分类特征并进行二分类判断，得到价值句序列；构建类别特征模板并计算子类语义特征；通过语义感知路由机制和混合专家模型进行多分类。本发明解决了现有文本分类无法充分利用深层语义信息，导致分类精度不足，且在类别不平衡和细粒度分类中表现不佳的技术问题，达到了通过引入双重语义特征编码和混合专家模型，显著提升分类精度，以及类别不平衡和细粒度分类能力的技术效果。

技术关键词

语义特征主题语义特征模板文本分类方法主题特征序列分层特征融合特征编码阶段细粒度分类科技滑动窗口解码器机制前馈神经网络注意力

系统为您推荐了相关专利信息

数据筛选方法和装置、电子设备及存储介质

数据分类模型噪声数据文本数据筛选方法噪声样本

基于多头协同矩阵标注和多特征融合的实体关系联合抽取方法

中文文本融合注意力机制三元组实体关系抽取深度编码

一种基于视觉内容相关性的灭火系统

火灾现场文本融合图像特征多模态编码模块

一种基于双次识别定位增强的移动应用无障碍字幕识别方法和装置

字幕识别方法识别模块定位文本位置二次识别方法消息

一种分类和问答大模型联合参数调整方法及装置

问答模型参数专业 BERT模型数据

嵌入科技文本语义特征编码的两阶段分类方法及系统

站点导航

APP 下载