视觉数据生成方法、多模态模型训练方法、装置及介质

正文

推荐专利

申请号：CN202411619665

申请日期：2024-11-13

公开号：CN119312796B

公开日期：2025-07-22

类型：发明专利

摘要

本申请提供的一种视觉数据生成方法、多模态模型训练方法、装置及介质，通过获得待生成视觉数据的描述信息；所述描述信息对应有风格触发词，以及风格触发词对应的图像区域内容信息；基于所述描述信息以及预先训练的多模态模型，获得输出视觉数据，使得所述输出视觉数据中至少两个区域的图像风格存在差异，有效提升图像生成的精确性和艺术性，并能够根据用户的需求生成多风格融合的图像，满足了用户对多种风格融合图像生成的需求。

技术关键词

风格数据生成方法视觉模型训练方法多模态自然语言数据生成装置图像分割同义词可读存储介质文本处理器电子设备模块计算机

系统为您推荐了相关专利信息

人行道预警方法、设备、存储介质及程序产品

人行道双目摄像机风险行人预警装置图像

一种基于多模态数据融合的HIV/AIDS患者智能监测与预警系统

多模态数据融合预警系统数据采集系统数据处理系统医学数据处理技术

一种基于微调大语言模型的半结构化访谈系统

大语言模型数据收集模块文本多模态情感分析语音特征参数

基于随机连接网络的辐射源识别模型训练方法及识别方法

识别模型训练方法辐射源识别方法前馈神经网络样本参数

基于多模态AI大模型的电力设备缺陷检测方法及系统

电力设备缺陷检测方法裂纹污垢判断绝缘子异常信息

视觉数据生成方法、多模态模型训练方法、装置及介质

站点导航

APP 下载