一种面向视觉场景图生成的多分支混合注意力模型

正文

推荐专利

申请号：CN202411066922

申请日期：2024-08-06

公开号：CN119007207A

公开日期：2024-11-22

类型：发明专利

摘要

本发明公开了一种面向视觉场景图生成的多分支混合注意力模型，首先对输入图像通过基础特征提取网络提取出特征图以及检测出图中所包含的目标；将提取出的特征划分为视觉、语义、和位置特征；上述特征输入到目标上下文传递模块进行上下文信息传递以及边上下文信息传递，得到每个目标对应的综合特征向量；得到综合向量后将所有综合向量按照目标对进行组合，同时将原始的各模态向量也按照目标对关系组合；将各目标对的特征输入至多分支混合注意力模块中提取关系对的综合特征并进行谓词分类，得到最终目标关系谓词预测结果。本发明设计了多分支混合注意模块与混合区域预处理结构，能够有效提升视觉场景图的生成准确度。

技术关键词

注意力模型分支关系场景视觉特征消息传递机制模块语义特征特征提取网络模态特征注意力机制输出特征图像阶段算法基础

系统为您推荐了相关专利信息

一种基于双层判断的跌倒行为检测方法

场景语义分割网络人体关键点注意力机制高效多尺度

基于元学习动态关系度量的智能垃圾分类方法、装置及介质

智能垃圾分类方法特征提取器融合特征关系网络智能垃圾分类装置

基于多模态大数据的商品管理方法及系统

多模态大数据商品管理方法节点管理策略商品管理系统

一种融合时空特征的GConvAttnLSTM多源遥感降水估计方法和系统

气象观测站融合时空特征样本邻域空间窗口估计方法

一种呼吸道感染病原体辅助诊断方法、装置及可读介质

呼吸道辅助诊断方法风险预测模型协同进化策略天冬氨酸转氨酶

一种面向视觉场景图生成的多分支混合注意力模型

站点导航

APP 下载