多模态数据生成方法、装置、系统、电子设备和存储介质

AITNT
正文
推荐专利
多模态数据生成方法、装置、系统、电子设备和存储介质
申请号:CN202410896723
申请日期:2024-07-04
公开号:CN118607576A
公开日期:2024-09-06
类型:发明专利
摘要
本公开提供了一种多模态数据生成方法,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型技术领域,具体涉及一种视觉智能体,该视觉智能体集成有视觉专家模型、多模态大模型以及大语言模型,可应用于AIGC(AI‑Generated Content)、人机交互等场景。具体实现方案为:根据来自目标对象的输入内容,确定目标对象的意图;响应于输入内容包括图像,根据意图,从视觉专家模型库中选取视觉专家模型,对图像进行处理,得到视觉专家结果;根据意图,从多模态模型库中选取多模态模型,基于视觉专家结果,对输入内容进行多模态处理,得到多模态处理结果;以及根据视觉专家结果和多模态处理结果,生成输出内容。
技术关键词
多模态 视觉 模型库 意图 大语言模型 数据生成方法 文本 模态特征 规划 图像处理 对象 数据生成系统 数据生成装置 模块 视频 电子设备 处理器 处理单元 人工智能技术
系统为您推荐了相关专利信息
1
一种基于人工智能的人体体重监测评估干预管理方法
身体健康数据 管理方法 体重 数据采集设备 特征值
2
一种头部姿态数据采集方法、装置、电子设备及介质
摄像单元 定位标记 数据采集方法 视觉 坐标系
3
一种基于机器视觉的织带瑕疵检测方法及系统
织带 瑕疵检测系统 数据分析模块 瑕疵检测方法 边缘检测
4
基于混合专家的视觉语言模型的令牌路由增强方法
令牌 视觉 负载均衡策略 序列 图像
5
基于边缘计算的智慧梁场实时监控方法及装置
混凝土温湿度 异常事件 梁场 特征提取模型 关键工艺参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号