一种基于图像生成驱动数据增强的海上开放词汇目标检测方法

AITNT
正文
推荐专利
一种基于图像生成驱动数据增强的海上开放词汇目标检测方法
申请号:CN202510196827
申请日期:2025-02-21
公开号:CN120125893A
公开日期:2025-06-10
类型:发明专利
摘要
一种基于图像生成驱动数据增强的海上开放词汇目标检测方法,包括利用大语言模型对现有海洋场景文本进行增强,生成涵盖多种环境条件、天气变化、时间状态及多目标细节的丰富场景描述,并进一步解析出物体类别及其空间布局信息;基于增强后的文本与空间布局数据,借助条件扩散模型生成多样化且复杂的海洋场景图像,为目标检测模型提供多元化的视觉训练数据;结合目标检测损失函数和多模态对齐损失函数,对开放词汇目标检测模型进行优化训练。本发明提升了对数据集中已掌握类型目标的检测精度,并能扩展至数据集中未覆盖的目标类型,增强了无人艇在复杂海洋环境中的感知效率与任务适应性,为海上安全巡逻、搜救及执法提供了更加可靠的技术支持。
技术关键词
海洋场景 检测损失 大语言模型 图像上下文信息 空间布局信息 感知系统 数据 多模态 无人艇 检测模型训练 文本特征向量 噪声估值 去噪模型 噪声强度 协方差矩阵 随机噪声 天气
系统为您推荐了相关专利信息
1
一种基于大模型的可视化网页数据爬取方法及系统
数据爬取方法 可视化网页 分布式任务调度框架 分布式爬虫框架 加权融合算法
2
语料信息处理方法、装置、电子设备和可读存储介质
大语言模型 标签 聚类 信息处理方法 计算机程序指令
3
基于迭代检索生成验证的查询方法、系统、设备及介质
生成文档 语句 大语言模型 查询方法 文本
4
一种基于大语言模型的医院后勤调度系统及方法
大语言模型 三元组 医院后勤服务 自然语言 数据
5
基于大语言模型的信息处理方法和装置
大语言模型 信息处理方法 意图 信息处理装置 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号