一种基于多模态大模型的目标检测优化方法

AITNT
正文
推荐专利
一种基于多模态大模型的目标检测优化方法
申请号:CN202510237659
申请日期:2025-03-03
公开号:CN120451610A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开一种基于多模态大模型的目标检测优化方法,具体包括如下步骤:获取视频流数据;将视频流抽帧后的图像输入预设的目标检测模型,输出图像中包含的目标检测框坐标信息;若目标检测框的置信度大于预设值,则将当前图片、目标检测框坐标信息一同上传至多模态大模型;多模态大模型接收坐标信息、图像信息、文本提示词,判断并输出当前图像是否包含指定目标。
技术关键词
检测优化方法 多模态 编码特征 坐标 推送业务系统 视频流 位置编码器 图像编码器 标记特征 文本 傅立叶 图片 适配器 特征点 答案 数据 云端 解码
系统为您推荐了相关专利信息
1
一种模型渲染方法、装置、电子设备和存储介质
模型渲染方法 虚拟对象 像素点 纹理 相机
2
基于AI视觉的卷取炉转毂带钢插入深度控制系统及方法
深度控制系统 带钢头部 视觉摄像机 多模态数据融合 视觉检测模块
3
一种居家守护陪伴系统机器人
陪伴系统 云端控制系统 运动控制模块 机器人 居家
4
多模态图像检测方法、对象检测网络训练方法及相关设备
对象检测 特征提取模型 融合图像特征 图像检测方法 生成预测图像
5
全息视频播放方法、装置、计算机设备及存储介质
关键帧 全息视频播放方法 神经网络参数 锚点 视频帧
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号