一种基于深度学习的多模态自动摘要方法

AITNT
正文
推荐专利
一种基于深度学习的多模态自动摘要方法
申请号:CN202411116131
申请日期:2024-08-14
公开号:CN119478968A
公开日期:2025-02-18
类型:发明专利
摘要
本发明涉及一种基于深度学习的多模态自动摘要方法,属于计算机自然语言处理技术领域。本发明包括步骤:1、利用BERT提取文本特征,利用GoogleNet提取图像特征;2、将提取的图文特征图文特征串联成串联向量;3、将文本特征和图像特征进行融合;4、将融合文本特征输入至文本摘要的解码器,采用解码器带有掩码的交叉注意力和自注意力计算得到文本摘要词向量的自回归结果,利用束搜索选取自回归序列中概率最大的自回归结果进行文本摘要输出;5、将融合图像特征输入至Softmax层,将样本中概率最大的样本图像进行图像摘要输出;与现有技术相比,本发明采用深度学习生成文本摘要和选择摘要最相关图片,能够准确的生成文本摘要和相关的图片,具有很强的实用性。
技术关键词
自动摘要方法 前馈神经网络 融合图像特征 文本特征向量 图像特征向量 生成文本摘要 注意力机制 解码器 计算机自然语言 预训练语言模型 矩阵 图文 预训练模型 线性 模态特征 样本
系统为您推荐了相关专利信息
1
BSDF广度追迹求解问题异构系统负载均衡方法及系统
异构系统 负载均衡系统 任务分配策略 负载均衡方法 模块
2
基于GAT和KAN的网络入侵检测方法
网络入侵检测方法 全局特征提取 过采样方法 样条 通讯网络拓扑结构
3
基于多视图自编码器的多组学数据缺失插补方法及系统
插补方法 交叉注意力机制 解码器 专用编码器 融合特征
4
一种轨道交通列车驾驶自动控制方法、系统及存储介质
轨道交通列车驾驶 深度强化学习算法 列车控制器 自动控制方法 速度
5
无人值守螺旋卸船机的靠泊预警方法
激光雷达点云数据 环境监测数据 状态监测数据 注意力 风险预测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号