基于多模态大模型的目标检测方法及其相关设备

AITNT
正文
推荐专利
基于多模态大模型的目标检测方法及其相关设备
申请号:CN202510368701
申请日期:2025-03-26
公开号:CN120259633A
公开日期:2025-07-04
类型:发明专利
摘要
本申请公开了一种基于多模态大模型的目标检测方法及其相关设备,涉及图像处理技术领域,本申请将第一检测问题输入至预设多模态大模型,由于第一检测问题涉及待检测图像和待检测目标,预设多模态大模型用于表征检测问题所涉及图像和所涉及的类别,以及目标在图像中的位置之间的关联关系,通过预设多模态大模型对第一检测问题进行处理,即可获得第一回答;相较于目前通过多模态大语言模型将文本描述与图像中的目标进行匹配,从而定位该物体的位置,本申请在未借助任何外部检测模块的情况下,实现了预设多模态大模型本身的目标检测能力。
技术关键词
多模态 计算机程序产品 标签 可读存储介质 图像处理技术 大语言模型 处理器 输入模块 关系 存储器 文本 物体
系统为您推荐了相关专利信息
1
车辆控制方法、装置、车辆、介质及程序产品
场景 文本 语音 车辆控制方法 数据
2
基于叶片追踪的红外辐射除冰方法及系统
叶片 队列 除冰方法 语义特征 时序
3
异构GPU池化直通调度方法、装置、设备及介质
调度算法 服务器 异构 标签 物理
4
胚胎发育潜力的评估方法、装置、计算机设备、可读存储介质和程序产品
胚胎 培养液 拉曼光谱数据 样本 拉曼光谱仪
5
一种面向滑坡灾害监测的非凸区域覆盖方法及系统
滑坡灾害监测 区域覆盖方法 数据处理模块 控制策略 搜索算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号