一种基于微调预训练大模型的多模态无人机图像目标检测方法

AITNT
正文
推荐专利
一种基于微调预训练大模型的多模态无人机图像目标检测方法
申请号:CN202411957026
申请日期:2024-12-29
公开号:CN119904764A
公开日期:2025-04-29
类型:发明专利
摘要
本申请提供了一种基于微调预训练大模型的多模态无人机图像目标检测方法,涉及计算机视觉技术领域,包括:获得无人机图像,进行预处理和标注后,得到无人机数据集;对Fast Segment Anything进行训练和验证,得到微调训练后的目标分割模型;构建目标网络模型,采用GroundingDINO和Fast Segment Anything作为预训练的大模型得到初始目标检测模型;S5、构建语音识别模型;S6、将语音识别模型添加到初始目标检测模型中,获得多模态全自动无人机图像目标检测模型。该方法实现了迁移学习,有效解决了现有技术中因无人机图像数据量少、复杂性高而导致的检测精度低和泛化性差的问题。
技术关键词
无人机数据 构建语音识别模型 电子转录设备 语音采集设备 计算机视觉技术 多模态 标注软件 图像匹配 网络 自然语言 检测头 音频 训练集 参数 文本 噪声
系统为您推荐了相关专利信息
1
基于AI视觉分析的猪排便位置训练方法
猪排 猪舍 驱赶装置 畜牧业管理技术 分析实时监控
2
一种基于平面高斯的着色模型构建方法、系统、装置及介质
模型构建方法 着色 透明度 颜色 深度图
3
一种3D打印混凝土的自动配筋方法及装置
配筋方法 抓取机器人 深度相机 打印机器人 配筋装置
4
复杂生物图像场景下实例分割任务文本化方法、系统及设备
实例分割 文本 译码器 图像匹配 生物
5
一种目标检测任务数据集生成方法及设备
仿真环境 工件轮廓 二值化图像 彩色图像 点光源
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号