一种基于城市多模态大模型的小目标物体检测方法及系统

正文

推荐专利

申请号：CN202510760468

申请日期：2025-06-09

公开号：CN120747580A

公开日期：2025-10-03

类型：发明专利

摘要

本发明提供了一种基于城市多模态大模型的小目标物体检测方法及系统，涉及智慧城市相关技术领域，包括以下步骤：S1、获得带有小目标物体检测框的原始图片以及指令文本；S2、对带有小目标物体检测框的原始图片进行压缩得到简略图；S3、对带有小目标物体检测框的原始图片上进行裁剪或压缩得到局部环境图；S4、在带有小目标物体检测框的原始图片上以小目标物体检测框的左上角为起点进行遍历切割得到若干个局部内部图；S5、将简略图、局部环境图和若干个局部内部图输入至城市多模态大模型中，得到带有图间隔标记的视觉嵌入特征；S6、根据带有图间隔标记的视觉嵌入特征和指令文本嵌入特征得到预测文本。

技术关键词

嵌入特征多模态物体检测方法文本指令视觉物体检测系统物体检测框标记街景图片模块分块像素

系统为您推荐了相关专利信息

一种皮带机运行异常探测方法、装置及电子设备

运输皮带皮带机曲线神经网络模型点云

多屏融合多信息源智能推送播放管理方法及系统

融合多信息源播放管理系统屏幕控制模块旅客画像播放管理方法

数据的归档方法、检索方法、装置、介质、设备和产品

归档方法数据检索方法文本场景

多模态脑机接口解码方法及相关装置

多模态脑机接口解码指令特征提取模块语义模态特征

卷积神经网络驱动的线上资源自动设计生成方法

设计生成方法卷积神经网络模型多模态资源元素

一种基于城市多模态大模型的小目标物体检测方法及系统

站点导航

APP 下载