多模态数据生成方法、装置、系统、电子设备和存储介质

正文

推荐专利

申请号：CN202410896723

申请日期：2024-07-04

公开号：CN118607576A

公开日期：2024-09-06

类型：发明专利

摘要

本公开提供了一种多模态数据生成方法，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型技术领域，具体涉及一种视觉智能体，该视觉智能体集成有视觉专家模型、多模态大模型以及大语言模型，可应用于AIGC（AI‑Generated Content）、人机交互等场景。具体实现方案为：根据来自目标对象的输入内容，确定目标对象的意图；响应于输入内容包括图像，根据意图，从视觉专家模型库中选取视觉专家模型，对图像进行处理，得到视觉专家结果；根据意图，从多模态模型库中选取多模态模型，基于视觉专家结果，对输入内容进行多模态处理，得到多模态处理结果；以及根据视觉专家结果和多模态处理结果，生成输出内容。

技术关键词

多模态视觉模型库意图大语言模型数据生成方法文本模态特征规划图像处理对象数据生成系统数据生成装置模块视频电子设备处理器处理单元人工智能技术

系统为您推荐了相关专利信息

一种基于人工智能的人体体重监测评估干预管理方法

身体健康数据管理方法体重数据采集设备特征值

一种头部姿态数据采集方法、装置、电子设备及介质

摄像单元定位标记数据采集方法视觉坐标系

一种基于机器视觉的织带瑕疵检测方法及系统

织带瑕疵检测系统数据分析模块瑕疵检测方法边缘检测

基于混合专家的视觉语言模型的令牌路由增强方法

令牌视觉负载均衡策略序列图像

基于边缘计算的智慧梁场实时监控方法及装置

混凝土温湿度异常事件梁场特征提取模型关键工艺参数

多模态数据生成方法、装置、系统、电子设备和存储介质

站点导航

APP 下载