一种基于多模态的文本摘要生成方法

正文

推荐专利

一种基于多模态的文本摘要生成方法

申请号：CN202410970130

申请日期：2024-07-19

公开号：CN118797038A

公开日期：2024-10-18

类型：发明专利

摘要

本发明公开了一种基于多模态的文本摘要生成方法，属于数据处理技术领域，具体包括：采集图像数据和文本数据，并分别进行预处理；基于卷积神经网络提取图像的视觉特征；使用自然语言处理技术对文本数据进行特征提取，通过词袋模型、TF‑IDF获取文本的语义特征，所述语义特征包括词频和逆文档频率；将图像和文本的特征进行融合，得到一个综合的多模态特征向量；融合方法包括简单拼接、加权融合、MLP模态融合；构建文本生成模型，以将多模态特征向量作为输入，生成摘要文本；使用ROUGE评估指标对生成的摘要文本进行评估；根据评估结果，对模型进行优化；本发明实现了生成具有准确度和流畅度的多模态摘要文本。

技术关键词

文本摘要生成方法多模态卷积神经网络提取文本生成模型语义特征词袋模型图像数据预处理融合方法视觉特征文本特征向量 ReLU函数图像特征向量频率分词自然语言前馈神经网络滤波器

系统为您推荐了相关专利信息

体育训练模型构建方法、装置、设备、存储介质及产品

训练场景动态语义特征模型构建方法数据模块时序特征

基于多模态大模型的内容生成方法及系统

内容框架展示单元内容分发节点多模态内容生成方法

一种数据处理方法、装置及设备

规则集关键词语义特征样本网格搜索算法

一种自主导航与实时监测集成的巡检机器人系统

巡检机器人系统自主导航系统多传感器融合视觉摄像头超声波传感器

一种基于机器视觉的电路板检测方法与系统

图像节点特征路径规划算法电路板检测方法相机镜头

一种基于多模态的文本摘要生成方法

站点导航

APP 下载