摘要
本申请提供的一种视觉数据生成方法、多模态模型训练方法、装置及介质,通过获得待生成视觉数据的描述信息;所述描述信息对应有风格触发词,以及风格触发词对应的图像区域内容信息;基于所述描述信息以及预先训练的多模态模型,获得输出视觉数据,使得所述输出视觉数据中至少两个区域的图像风格存在差异,有效提升图像生成的精确性和艺术性,并能够根据用户的需求生成多风格融合的图像,满足了用户对多种风格融合图像生成的需求。
技术关键词
风格
数据生成方法
视觉
模型训练方法
多模态
自然语言
数据生成装置
图像分割
同义词
可读存储介质
文本
处理器
电子设备
模块
计算机
系统为您推荐了相关专利信息
多模态数据融合
预警系统
数据采集系统
数据处理系统
医学数据处理技术
大语言模型
数据收集模块
文本
多模态情感分析
语音特征参数
识别模型训练方法
辐射源识别方法
前馈神经网络
样本
参数
电力设备缺陷检测方法
裂纹
污垢
判断绝缘子
异常信息