全景分割与多视觉特征协同的图像描述生成方法

AITNT
正文
推荐专利
全景分割与多视觉特征协同的图像描述生成方法
申请号:CN202410733297
申请日期:2024-06-07
公开号:CN118736361B
公开日期:2025-02-07
类型:发明专利
摘要
本发明提供了一种全景分割与多视觉特征协同的图像描述生成方法,包括:提取输入图像的网格特征和基于全景分割的掩膜特征并编码;通过双流交叉注意力将文本语义特征与网格特征和掩膜特征进行交叉融合。
技术关键词
网格特征 视觉特征 语义特征 残差归一化 注意力机制 图像 融合特征 生成方法 文本 解码器 掩膜矩阵 编码 索引 上采样 像素点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号