全景分割与多视觉特征协同的图像描述生成方法
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
全景分割与多视觉特征协同的图像描述生成方法
申请号:
CN202410733297
申请日期:
2024-06-07
公开号:
CN118736361B
公开日期:
2025-02-07
类型:
发明专利
摘要
本发明提供了一种全景分割与多视觉特征协同的图像描述生成方法,包括:提取输入图像的网格特征和基于全景分割的掩膜特征并编码;通过双流交叉注意力将文本语义特征与网格特征和掩膜特征进行交叉融合。
技术关键词
网格特征
视觉特征
语义特征
残差归一化
注意力机制
图像
融合特征
生成方法
文本
解码器
掩膜矩阵
编码
索引
上采样
像素点
沪ICP备2023015588号