自动获取用于多模态图像生成模型的专业类数据集的方法

AITNT
正文
推荐专利
自动获取用于多模态图像生成模型的专业类数据集的方法
申请号:CN202410919888
申请日期:2024-07-10
公开号:CN118918411A
公开日期:2024-11-08
类型:发明专利
摘要
本发明公开了一种自动获取用于多模态图像生成模型的专业类数据集的方法,包括:获得该专业的原始图像数据集;按照分辨率和长宽比例要求对原始图像数据集中的图像进行筛选和调整,得到第二图像数据集;对第二图像数据集中的图像进行分类,得到所需类别的第一图像子数据集;将该专业的结构化描述文档输入第一多模态大语言模型,对所需类别的第一图像子数据集中的图像进行质量评价,剔除不符合图像质量评价标准的图像,得到第二图像子数据集;将改专业的标注公式范例输入第二多模态大语言模型,对第二图像子数据集中的图像进行特征标注,得到包含图像及其对应标注公式的图文对子数据集。本申请可以自动生成用于多模态图像生成模型的各种专业类数据集。
技术关键词
多模态 大语言模型 图像生成模型 专业 图文 原始图像数据 电子设备 图像识别算法 检查特征 设计主体 网站结构 分辨率 图像获取模块 可读存储介质 存储计算机程序 计算机程序产品 文本识别 项目
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号