摘要
本公开提供了一种数据生成、多模态模型训练及处理方法、装置、设备、介质和产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。数据生成方法包括:获取原始图文描述数据,所述原始图文描述数据包括:原始图像数据和原始文本数据;采用大语言模型,对所述原始文本数据进行提取,以获得目标问题;采用多模态模型,基于所述目标问题识别所述原始图像数据,以获得目标答案;基于所述目标答案和所述原始图文描述数据,生成目标图文描述数据。
技术关键词
图文
原始图像数据
文本
多模态
答案
大语言模型
数据生成方法
数据生成装置
模型训练装置
模型训练方法
人工智能技术
模块
计算机程序产品
计算机视觉
处理器通信
指令
可读存储介质
系统为您推荐了相关专利信息
特征识别方法
社区检测方法
矩阵
亲和力
动态社区
联合嵌入模型
表格
神经网络模型
基础
计算机执行指令
改良方法
改良系统
多模态
耦合动力学
肠道微生物群落
智慧安检方法
安检图像
多模态
交叉注意力机制
匈牙利算法
预训练模型
生成方法
大语言模型
文本生成技术
词嵌入模型