一种基于预训练语言模型融合深度卷积网络的文本分类方法

正文

推荐专利

申请号：CN202510092996

申请日期：2025-01-21

公开号：CN120011558A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于预训练语言模型融合深度卷积网络的文本分类方法，包括以下步骤：首先，通过RoBERTa模型对输入文本进行特征提取；然后，将RoBERTa输出的特征输入多头注意力网络，获取深度语义信息；接着，将多头注意力的输出输入到多层残差结构的卷积神经网络中，获取深层卷积网络特征；最后，将多头注意力的输出引入可学习维度变换矩阵，通过优化维度特征，生成适合分类任务的低维表示，并与多层卷积神经网络的输出在全局最大池化操作后进行融合，统一全局和局部特征的语义表示。融合后的特征通过全连接层生成最终的分类结果。本发明通过多头注意力机制和深度卷积网络的融合，能够充分提取全局语义和局部特征，从而显著提高了分类任务的效率与效果。

技术关键词

深度卷积网络预训练语言模型文本分类方法多层卷积神经网络深层卷积网络残差结构语义多头注意力机制矩阵非线性阶段

系统为您推荐了相关专利信息

一种基于Transformer的统一信息抽取方法

信息抽取方法前馈神经网络状态机双向注意力机制编码器

语言模型训练方法、对话答复生成方法、装置及介质

文本生成方法数据预训练语言模型语言模型训练方法

一种多模态数据融合的金融服务信息处理方法及系统

语义向量三元组文本信息处理方法跨模态

一种基于代码属性图和大模型的代码缺陷自动修复方法

代码缺陷预训练语言模型节点自动修复方法动态剪枝

一种跨领域对话槽填充方法、系统、设备及存储介质

预训练语言模型槽填充方法参数填充系统数据处理模块

一种基于预训练语言模型融合深度卷积网络的文本分类方法

站点导航

APP 下载