一种基于城市多模态大模型的小目标物体检测方法及系统

AITNT
正文
推荐专利
一种基于城市多模态大模型的小目标物体检测方法及系统
申请号:CN202510760468
申请日期:2025-06-09
公开号:CN120747580A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供了一种基于城市多模态大模型的小目标物体检测方法及系统,涉及智慧城市相关技术领域,包括以下步骤:S1、获得带有小目标物体检测框的原始图片以及指令文本;S2、对带有小目标物体检测框的原始图片进行压缩得到简略图;S3、对带有小目标物体检测框的原始图片上进行裁剪或压缩得到局部环境图;S4、在带有小目标物体检测框的原始图片上以小目标物体检测框的左上角为起点进行遍历切割得到若干个局部内部图;S5、将简略图、局部环境图和若干个局部内部图输入至城市多模态大模型中,得到带有图间隔标记的视觉嵌入特征;S6、根据带有图间隔标记的视觉嵌入特征和指令文本嵌入特征得到预测文本。
技术关键词
嵌入特征 多模态 物体检测方法 文本 指令 视觉 物体检测系统 物体检测框 标记 街景图片 模块 分块 像素
系统为您推荐了相关专利信息
1
一种皮带机运行异常探测方法、装置及电子设备
运输皮带 皮带机 曲线 神经网络模型 点云
2
多屏融合多信息源智能推送播放管理方法及系统
融合多信息源 播放管理系统 屏幕控制模块 旅客画像 播放管理方法
3
数据的归档方法、检索方法、装置、介质、设备和产品
归档方法 数据 检索方法 文本 场景
4
多模态脑机接口解码方法及相关装置
多模态脑机接口 解码指令 特征提取模块 语义 模态特征
5
卷积神经网络驱动的线上资源自动设计生成方法
设计生成方法 卷积神经网络模型 多模态 资源 元素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号