一种基于预训练语言模型融合深度卷积网络的文本分类方法

AITNT
正文
推荐专利
一种基于预训练语言模型融合深度卷积网络的文本分类方法
申请号:CN202510092996
申请日期:2025-01-21
公开号:CN120011558A
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种基于预训练语言模型融合深度卷积网络的文本分类方法,包括以下步骤:首先,通过RoBERTa模型对输入文本进行特征提取;然后,将RoBERTa输出的特征输入多头注意力网络,获取深度语义信息;接着,将多头注意力的输出输入到多层残差结构的卷积神经网络中,获取深层卷积网络特征;最后,将多头注意力的输出引入可学习维度变换矩阵,通过优化维度特征,生成适合分类任务的低维表示,并与多层卷积神经网络的输出在全局最大池化操作后进行融合,统一全局和局部特征的语义表示。融合后的特征通过全连接层生成最终的分类结果。本发明通过多头注意力机制和深度卷积网络的融合,能够充分提取全局语义和局部特征,从而显著提高了分类任务的效率与效果。
技术关键词
深度卷积网络 预训练语言模型 文本分类方法 多层卷积神经网络 深层卷积网络 残差结构 语义 多头注意力机制 矩阵 非线性 阶段
系统为您推荐了相关专利信息
1
一种基于Transformer的统一信息抽取方法
信息抽取方法 前馈神经网络 状态机 双向注意力机制 编码器
2
语言模型训练方法、对话答复生成方法、装置及介质
文本 生成方法 数据 预训练语言模型 语言模型训练方法
3
一种多模态数据融合的金融服务信息处理方法及系统
语义向量 三元组 文本 信息处理方法 跨模态
4
一种基于代码属性图和大模型的代码缺陷自动修复方法
代码缺陷 预训练语言模型 节点 自动修复方法 动态剪枝
5
一种跨领域对话槽填充方法、系统、设备及存储介质
预训练语言模型 槽填充方法 参数 填充系统 数据处理模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号