多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品

正文

推荐专利

申请号：CN202411863896

申请日期：2024-12-16

公开号：CN119693713A

公开日期：2025-03-25

类型：发明专利

摘要

本公开提供了一种多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于多模态识别和分类场景。该多模态大模型的训练方法包括：获取训练样本集，其中，训练样本集包括多个训练样本对，每个训练样本对包括样本图像、样本文本和用于样本图像的类别描述；将每个训练样本对分别输入至待训练的大模型，得到每个样本图像各自的类别信息；以及，利用每个训练样本对各自的类别描述和类别信息，训练待训练的大模型，得到用于图像分类的多模态大模型。

技术关键词

多模态训练样本集融合特征文本图像特征提取图像分类方法特征提取模块大语言模型标记输入模块图像分类装置分类场景人工智能技术计算机程序产品处理器计算机视觉

系统为您推荐了相关专利信息

一种基于大数据分析的数字化管理方法及系统

数字化管理方法语义乘法器序列子系统

基于多模态胶囊网络进行影像融合的土地覆盖分类方法及系统

合成孔径雷达影像土地覆盖分类方法胶囊网络模型多模态残差结构

一种基于AR辅助的车架支架安装情况检测方法、计算机系统及计算机可读存储介质

车架支架分支语义融合特征三维点云数据

一种基于AI技术的固体废物堆场远程巡航及隐患识别系统

固体废物堆场多源监测数据可见光图像渗滤液识别系统

基于自适应学习的跨语言资讯数据采集与结构化处理方法

协方差矩阵元学习策略语义线性分类器动态特征提取

多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品

站点导航

APP 下载