摘要
一种基于图像生成驱动数据增强的海上开放词汇目标检测方法,包括利用大语言模型对现有海洋场景文本进行增强,生成涵盖多种环境条件、天气变化、时间状态及多目标细节的丰富场景描述,并进一步解析出物体类别及其空间布局信息;基于增强后的文本与空间布局数据,借助条件扩散模型生成多样化且复杂的海洋场景图像,为目标检测模型提供多元化的视觉训练数据;结合目标检测损失函数和多模态对齐损失函数,对开放词汇目标检测模型进行优化训练。本发明提升了对数据集中已掌握类型目标的检测精度,并能扩展至数据集中未覆盖的目标类型,增强了无人艇在复杂海洋环境中的感知效率与任务适应性,为海上安全巡逻、搜救及执法提供了更加可靠的技术支持。
技术关键词
海洋场景
检测损失
大语言模型
图像上下文信息
空间布局信息
感知系统
数据
多模态
无人艇
检测模型训练
文本特征向量
噪声估值
去噪模型
噪声强度
协方差矩阵
随机噪声
天气
系统为您推荐了相关专利信息
数据爬取方法
可视化网页
分布式任务调度框架
分布式爬虫框架
加权融合算法
大语言模型
标签
聚类
信息处理方法
计算机程序指令
大语言模型
信息处理方法
意图
信息处理装置
处理器