一种基于微调预训练大模型的多模态无人机图像目标检测方法

正文

推荐专利

申请号：CN202411957026

申请日期：2024-12-29

公开号：CN119904764A

公开日期：2025-04-29

类型：发明专利

摘要

本申请提供了一种基于微调预训练大模型的多模态无人机图像目标检测方法，涉及计算机视觉技术领域，包括：获得无人机图像，进行预处理和标注后，得到无人机数据集；对Fast Segment Anything进行训练和验证，得到微调训练后的目标分割模型；构建目标网络模型，采用GroundingDINO和Fast Segment Anything作为预训练的大模型得到初始目标检测模型；S5、构建语音识别模型；S6、将语音识别模型添加到初始目标检测模型中，获得多模态全自动无人机图像目标检测模型。该方法实现了迁移学习，有效解决了现有技术中因无人机图像数据量少、复杂性高而导致的检测精度低和泛化性差的问题。

技术关键词

无人机数据构建语音识别模型电子转录设备语音采集设备计算机视觉技术多模态标注软件图像匹配网络自然语言检测头音频训练集参数文本噪声

系统为您推荐了相关专利信息

基于AI视觉分析的猪排便位置训练方法

猪排猪舍驱赶装置畜牧业管理技术分析实时监控

一种基于平面高斯的着色模型构建方法、系统、装置及介质

模型构建方法着色透明度颜色深度图

一种3D打印混凝土的自动配筋方法及装置

配筋方法抓取机器人深度相机打印机器人配筋装置

复杂生物图像场景下实例分割任务文本化方法、系统及设备

实例分割文本译码器图像匹配生物

一种目标检测任务数据集生成方法及设备

仿真环境工件轮廓二值化图像彩色图像点光源

一种基于微调预训练大模型的多模态无人机图像目标检测方法

站点导航

APP 下载