基于多尺度原型网络的场景图生成方法

AITNT
正文
推荐专利
基于多尺度原型网络的场景图生成方法
申请号:CN202410778151
申请日期:2024-06-17
公开号:CN118799426A
公开日期:2024-10-18
类型:发明专利
摘要
本发明涉及一种基于多尺度原型网络的场景图生成方法。所述方法包括:通过双重交叉注意力网络聚合多模态交互信息,并基于多模态交互信息提取主体特征、客体特征;对主体特征、客体特征进行关系融合,通过MLP网络得到关系表示结果;通过Kmeans聚类算法,依据关系表示结果为每个关系类归纳出聚类中心原型,得到视觉原型;通过GloVe算法根据谓词标签到语义原型;通过不同的MLP网络分别对视觉原型、语义原型进行处理并聚合,得到多尺度谓词原型;根据多尺度谓词原型进行谓词类别预测,并基于谓词预测结果生成场景图。通过采用双重交叉注意力网络,可以实现跨通道、跨模态的信息交互融合;能准确捕获主体和客体之间的关联性,从而提高场景图生成效果。
技术关键词
原型 多尺度 多模态交互 生成方法 注意力 网络 关系 多层感知器 生成场景 视觉特征 算法 语义特征 捕获主体 标签 定义特征 聚类 跨模态
系统为您推荐了相关专利信息
1
一种遥感影像任意方向目标检测方法
联合损失函数 遥感影像数据 特征提取网络 检测损失 光流场
2
一种WiFi路由器产品测试方法
波动特征 编码向量 产品测试方法 路由器 激励响应分析
3
一种基于深度学习的危岩体裂缝检测方法、系统、装置和及存储介质
裂缝检测方法 裂缝检测系统 输出特征 像素 空间金字塔
4
基于图像增强的古建筑修缮效果评估方法
古建筑修缮 图像增强 通道注意力机制 基底层 群搜索算法
5
一种基于注意力机制的单轮联邦学习推理方法和系统
注意力机制 推理方法 校准方法 矩阵 单轮
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号