目标检测方法、装置、设备、存储介质及计算机程序产品

正文

推荐专利

申请号：CN202510495707

申请日期：2025-04-18

公开号：CN120411475A

公开日期：2025-08-01

类型：发明专利

摘要

本申请涉及图像检测技术领域，公开了一种目标检测方法、装置、设备、存储介质及计算机程序产品，该方法包括：响应于目标检测请求，调用预设多模态大语言模型，其中，预设多模态大语言模型中设置有特征融合模块，通过特征融合模块将预设查询特征与待检测图像的视觉特征进行跨模态融合，获得融合后查询特征，其中，预设查询特征为可学习参数的向量矩阵，基于融合后查询特征对待检测图像进行目标检测，获得待检测图像的目标检测结果；由于本申请通过在预设多模态大语言模型中设置特征融合模块，实现了查询特征与待检测图像的视觉特征的跨模态融合，从而实现了通过多模态大语言模型直接对图像进行目标检测，进而降低了检测流程的复杂性。

技术关键词

查询特征大语言模型多模态计算机程序产品视觉特征跨模态图像检测技术对象模块检测设备处理器矩阵文本存储器参数样本

系统为您推荐了相关专利信息

一种自动紧急避让方法、介质、程序、控制器和车辆

路面附着系数环境感知数据车辆运行数据横摆角速度轨迹

锂电池的参数辨识方法、装置、设备、存储介质及产品

模式搜索方法等效电路模型粒子参数辨识方法锂电池

直播评论分析方法、装置、存储介质及计算机设备

评论分析方法语义向量关键词计算机可读指令聚类

一种基于AI多模态测评与虚拟仿真的财经英语学习方法

英语学习方法情感特征动态虚拟仿真技术多模态

面向政务信息的小型语言模型的释义生成方法、装置

预训练模型生成方法大语言模型文本生成技术词嵌入模型

目标检测方法、装置、设备、存储介质及计算机程序产品

站点导航

APP 下载