摘要
本发明公开了一种基于Agent的自动化图像训练数据生成方法,包括如下步骤:对作为数据集的高清图像数据进行预处理,裁剪成适合VLLM输入的尺寸并记录位置;将处理后的图像传入小型机器学习算法过滤掉信息量低的部分图像;把经过处理的图像传入VLLM模型生成详细描述;依据描述生成问答对;根据问答对生成的基本事实内容,用目标检测模型识别位置并输出目标框;将问答对、基本事实内容及其目标框信息整合成训练数据供深度学习模型使用。本发明能够自动化生成高质量图像训练数据,提高数据处理效率和深度学习模型训练效果。
技术关键词
训练数据生成方法
生成高质量图像
机器学习算法
深度学习模型训练
场景
高清
建筑
指示牌
物体
服装
标志
布局
尺寸
光照
图片
实体
图案