一种基于可控背景混合的图像扩增方法及系统

正文

推荐专利

申请号：CN202411597255

申请日期：2024-11-11

公开号：CN119152312B

公开日期：2025-02-28

类型：发明专利

摘要

本发明公开了一种基于可控背景混合的图像扩增方法及系统，该方法包括：基于视觉语言大模型获取原始图像数据集中每个图像的前景对象及背景信息的描述文本，得到多模态数据集；利用大语言模型根据多模态数据集对前景对象进行分类、对背景信息进行关键词提取，得到每个类别的前景对象对应的背景关键词；对每类前景对象的背景关键词进行均衡性分析，确定背景均衡方案；基于背景均衡方案生成扩增图像，将所述扩增图像添加到所述原始图像数据集中补充每类前景对象缺少的背景信息，得到背景均衡的扩展数据集。本发明能够充分利用背景的上下文信息，通过处理图像背景完成数据扩增，实现数据集的标签零污染，帮助提高模型的泛化能力。

技术关键词

图像扩增方法原始图像数据关键词对象大语言模型文本多模态图像分割图片视觉扩增系统可读存储介质生成方法模块计算机样本爬虫词典

一种基于可控背景混合的图像扩增方法及系统

站点导航

APP 下载