基于多尺度原型网络的场景图生成方法

正文

推荐专利

基于多尺度原型网络的场景图生成方法

申请号：CN202410778151

申请日期：2024-06-17

公开号：CN118799426A

公开日期：2024-10-18

类型：发明专利

摘要

本发明涉及一种基于多尺度原型网络的场景图生成方法。所述方法包括：通过双重交叉注意力网络聚合多模态交互信息，并基于多模态交互信息提取主体特征、客体特征；对主体特征、客体特征进行关系融合，通过MLP网络得到关系表示结果；通过Kmeans聚类算法，依据关系表示结果为每个关系类归纳出聚类中心原型，得到视觉原型；通过GloVe算法根据谓词标签到语义原型；通过不同的MLP网络分别对视觉原型、语义原型进行处理并聚合，得到多尺度谓词原型；根据多尺度谓词原型进行谓词类别预测，并基于谓词预测结果生成场景图。通过采用双重交叉注意力网络，可以实现跨通道、跨模态的信息交互融合；能准确捕获主体和客体之间的关联性，从而提高场景图生成效果。

技术关键词

原型多尺度多模态交互生成方法注意力网络关系多层感知器生成场景视觉特征算法语义特征捕获主体标签定义特征聚类跨模态

系统为您推荐了相关专利信息

一种遥感影像任意方向目标检测方法

联合损失函数遥感影像数据特征提取网络检测损失光流场

一种WiFi路由器产品测试方法

波动特征编码向量产品测试方法路由器激励响应分析

一种基于深度学习的危岩体裂缝检测方法、系统、装置和及存储介质

裂缝检测方法裂缝检测系统输出特征像素空间金字塔

基于图像增强的古建筑修缮效果评估方法

古建筑修缮图像增强通道注意力机制基底层群搜索算法

一种基于注意力机制的单轮联邦学习推理方法和系统

注意力机制推理方法校准方法矩阵单轮

基于多尺度原型网络的场景图生成方法

站点导航

APP 下载