一种基于深度信息融合的视觉空间描述方法、系统及产品

正文

推荐专利

申请号：CN202411866804

申请日期：2024-12-18

公开号：CN119322986B

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体公开了一种基于深度信息融合的视觉空间描述方法、系统及产品，方法包括：获取图像及其对应的物体文本；对所述图像进行视觉‑平面位置特征提取，得到视觉特征和平面位置特征，对所述图像进行深度特征提取，得到深度特征；对所述物体文本进行文本编码，得到文本特征；将所述视觉特征、平面位置特征、深度特征和文本特征进行特征融合，得到融合特征；对所述融合特征进行空间关系分类，得到空间关系；将指令语、所述空间关系和物体文本输入大语言模型，得到描述物体空间关系的自然语句。本发明能够准确描述图像中物体间的空间关系，提升人工智能的空间感知能力，同时避免增加多余的人工标注工作量。

技术关键词

深度信息融合深度特征提取融合特征分类神经网络关系分类器文本深度值信息特征提取模块大语言模型视觉特征提取图像编码模块物体深度信息深度估计方法空间位置关系

系统为您推荐了相关专利信息

不完整多组学癌症亚型数据聚类方法

数据聚类方法样本语义重构交叉注意力机制

一种利用多源数据的智能医疗诊断与决策支持方法

智能医疗诊断决策支持方法医疗诊断模型浮点型数据模态特征

一种多模态融合癌症生存期预测系统及存储介质

图像特征数据基因融合特征可读存储介质分类器

基于毫米波雷达与标签融合的人员跌倒监测方法及系统

跌倒监测方法多普勒信号 MUSIC算法协方差矩阵

一种流量采集系统、威胁分析方法及策略生成方法

融合特征威胁分析方法流量采集系统智能体平台自定义策略

一种基于深度信息融合的视觉空间描述方法、系统及产品

站点导航

APP 下载