一种基于多模态大模型的目标检测优化方法

正文

推荐专利

一种基于多模态大模型的目标检测优化方法

申请号：CN202510237659

申请日期：2025-03-03

公开号：CN120451610A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开一种基于多模态大模型的目标检测优化方法，具体包括如下步骤：获取视频流数据；将视频流抽帧后的图像输入预设的目标检测模型，输出图像中包含的目标检测框坐标信息；若目标检测框的置信度大于预设值，则将当前图片、目标检测框坐标信息一同上传至多模态大模型；多模态大模型接收坐标信息、图像信息、文本提示词，判断并输出当前图像是否包含指定目标。

技术关键词

检测优化方法多模态编码特征坐标推送业务系统视频流位置编码器图像编码器标记特征文本傅立叶图片适配器特征点答案数据云端解码

系统为您推荐了相关专利信息

一种模型渲染方法、装置、电子设备和存储介质

模型渲染方法虚拟对象像素点纹理相机

基于AI视觉的卷取炉转毂带钢插入深度控制系统及方法

深度控制系统带钢头部视觉摄像机多模态数据融合视觉检测模块

一种居家守护陪伴系统机器人

陪伴系统云端控制系统运动控制模块机器人居家

多模态图像检测方法、对象检测网络训练方法及相关设备

对象检测特征提取模型融合图像特征图像检测方法生成预测图像

全息视频播放方法、装置、计算机设备及存储介质

关键帧全息视频播放方法神经网络参数锚点视频帧

一种基于多模态大模型的目标检测优化方法

站点导航

APP 下载