一种基于图像生成驱动数据增强的海上开放词汇目标检测方法

正文

推荐专利

申请号：CN202510196827

申请日期：2025-02-21

公开号：CN120125893A

公开日期：2025-06-10

类型：发明专利

摘要

一种基于图像生成驱动数据增强的海上开放词汇目标检测方法，包括利用大语言模型对现有海洋场景文本进行增强，生成涵盖多种环境条件、天气变化、时间状态及多目标细节的丰富场景描述，并进一步解析出物体类别及其空间布局信息；基于增强后的文本与空间布局数据，借助条件扩散模型生成多样化且复杂的海洋场景图像，为目标检测模型提供多元化的视觉训练数据；结合目标检测损失函数和多模态对齐损失函数，对开放词汇目标检测模型进行优化训练。本发明提升了对数据集中已掌握类型目标的检测精度，并能扩展至数据集中未覆盖的目标类型，增强了无人艇在复杂海洋环境中的感知效率与任务适应性，为海上安全巡逻、搜救及执法提供了更加可靠的技术支持。

技术关键词

海洋场景检测损失大语言模型图像上下文信息空间布局信息感知系统数据多模态无人艇检测模型训练文本特征向量噪声估值去噪模型噪声强度协方差矩阵随机噪声天气

系统为您推荐了相关专利信息

一种基于大模型的可视化网页数据爬取方法及系统

数据爬取方法可视化网页分布式任务调度框架分布式爬虫框架加权融合算法

语料信息处理方法、装置、电子设备和可读存储介质

大语言模型标签聚类信息处理方法计算机程序指令

基于迭代检索生成验证的查询方法、系统、设备及介质

生成文档语句大语言模型查询方法文本

一种基于大语言模型的医院后勤调度系统及方法

大语言模型三元组医院后勤服务自然语言数据

基于大语言模型的信息处理方法和装置

大语言模型信息处理方法意图信息处理装置处理器

一种基于图像生成驱动数据增强的海上开放词汇目标检测方法

站点导航

APP 下载