视觉数据生成方法、多模态模型训练方法、装置及介质

AITNT
正文
推荐专利
视觉数据生成方法、多模态模型训练方法、装置及介质
申请号:CN202411619665
申请日期:2024-11-13
公开号:CN119312796B
公开日期:2025-07-22
类型:发明专利
摘要
本申请提供的一种视觉数据生成方法、多模态模型训练方法、装置及介质,通过获得待生成视觉数据的描述信息;所述描述信息对应有风格触发词,以及风格触发词对应的图像区域内容信息;基于所述描述信息以及预先训练的多模态模型,获得输出视觉数据,使得所述输出视觉数据中至少两个区域的图像风格存在差异,有效提升图像生成的精确性和艺术性,并能够根据用户的需求生成多风格融合的图像,满足了用户对多种风格融合图像生成的需求。
技术关键词
风格 数据生成方法 视觉 模型训练方法 多模态 自然语言 数据生成装置 图像分割 同义词 可读存储介质 文本 处理器 电子设备 模块 计算机
系统为您推荐了相关专利信息
1
人行道预警方法、设备、存储介质及程序产品
人行道 双目摄像机 风险 行人预警装置 图像
2
一种基于多模态数据融合的HIV/AIDS患者智能监测与预警系统
多模态数据融合 预警系统 数据采集系统 数据处理系统 医学数据处理技术
3
一种基于微调大语言模型的半结构化访谈系统
大语言模型 数据收集模块 文本 多模态情感分析 语音特征参数
4
基于随机连接网络的辐射源识别模型训练方法及识别方法
识别模型训练方法 辐射源识别方法 前馈神经网络 样本 参数
5
基于多模态AI大模型的电力设备缺陷检测方法及系统
电力设备缺陷检测方法 裂纹 污垢 判断绝缘子 异常信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号