特定场景下图像数据集生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510027513

申请日期：2025-01-08

公开号：CN120047767A

公开日期：2025-05-27

类型：发明专利

摘要

本公开涉及计算机技术领域，公开了特定场景下图像数据集生成方法、装置、设备及存储介质，该方法包括：将特定场景对应的文字信息输入大语言模型，得到提示词；将提示词输入扩散模型，生成与提示词对应的图像信息；基于图像信息，生成多种视觉标注，其中，视觉标注用于对图像信息添加标签标识；根据图像信息和多种视觉标注，构建特定场景下的图像数据集。本公开使用大语言模型和扩散模型生成特定场景下真实感强的图像信息，降低了采集真实数据的成本和时间，能够有效地生成特定场景下稀缺的图像数据，从而丰富图像数据集的多样性。

技术关键词

图像视觉生成方法大语言模型文件夹场景数据可读存储介质指令计算机程序产品文本编码模块参数存储器生成装置标签处理器计算机设备真实感

系统为您推荐了相关专利信息

一种基于大模型的驾考领域的多模态智能问答机器人及其开发方法

智能问答机器人开发方法预训练模型支持语音交互生成图像信息

发动机凸轮轴盖的全自动化装配设备

自动化装配设备发动机凸轮轴协作机器人送料机夹爪气缸

基于深度学习的冠脉造影钙化识别方法、系统及存储介质

冠脉造影焦点损失函数 CT血管造影识别方法计算机存储介质

一种基于超敏荧光量子点的超分辨率荧光成像分析方法

荧光成像分析方法三维荧光光谱数据显微镜系统十二烯基丁二酸酐生成对抗网络

一种基于SEGVOL的髋关节图像分割分析系统及方法

图像分割分析单元空间位置偏差数据分析模块人机交互模块

特定场景下图像数据集生成方法、装置、设备及存储介质

站点导航

APP 下载