一种基于深度学习的多模态自动摘要方法

正文

推荐专利

一种基于深度学习的多模态自动摘要方法

申请号：CN202411116131

申请日期：2024-08-14

公开号：CN119478968A

公开日期：2025-02-18

类型：发明专利

摘要

本发明涉及一种基于深度学习的多模态自动摘要方法，属于计算机自然语言处理技术领域。本发明包括步骤：1、利用BERT提取文本特征，利用GoogleNet提取图像特征；2、将提取的图文特征图文特征串联成串联向量；3、将文本特征和图像特征进行融合；4、将融合文本特征输入至文本摘要的解码器，采用解码器带有掩码的交叉注意力和自注意力计算得到文本摘要词向量的自回归结果，利用束搜索选取自回归序列中概率最大的自回归结果进行文本摘要输出；5、将融合图像特征输入至Softmax层，将样本中概率最大的样本图像进行图像摘要输出；与现有技术相比，本发明采用深度学习生成文本摘要和选择摘要最相关图片，能够准确的生成文本摘要和相关的图片，具有很强的实用性。

技术关键词

自动摘要方法前馈神经网络融合图像特征文本特征向量图像特征向量生成文本摘要注意力机制解码器计算机自然语言预训练语言模型矩阵图文预训练模型线性模态特征样本

系统为您推荐了相关专利信息

BSDF广度追迹求解问题异构系统负载均衡方法及系统

异构系统负载均衡系统任务分配策略负载均衡方法模块

基于GAT和KAN的网络入侵检测方法

网络入侵检测方法全局特征提取过采样方法样条通讯网络拓扑结构

基于多视图自编码器的多组学数据缺失插补方法及系统

插补方法交叉注意力机制解码器专用编码器融合特征

一种轨道交通列车驾驶自动控制方法、系统及存储介质

轨道交通列车驾驶深度强化学习算法列车控制器自动控制方法速度

无人值守螺旋卸船机的靠泊预警方法

激光雷达点云数据环境监测数据状态监测数据注意力风险预测模型

一种基于深度学习的多模态自动摘要方法

站点导航

APP 下载