多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品

AITNT
正文
推荐专利
多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品
申请号:CN202411863896
申请日期:2024-12-16
公开号:CN119693713A
公开日期:2025-03-25
类型:发明专利
摘要
本公开提供了一种多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于多模态识别和分类场景。该多模态大模型的训练方法包括:获取训练样本集,其中,训练样本集包括多个训练样本对,每个训练样本对包括样本图像、样本文本和用于样本图像的类别描述;将每个训练样本对分别输入至待训练的大模型,得到每个样本图像各自的类别信息;以及,利用每个训练样本对各自的类别描述和类别信息,训练待训练的大模型,得到用于图像分类的多模态大模型。
技术关键词
多模态 训练样本集 融合特征 文本 图像特征提取 图像分类方法 特征提取模块 大语言模型 标记 输入模块 图像分类装置 分类场景 人工智能技术 计算机程序产品 处理器 计算机视觉
系统为您推荐了相关专利信息
1
一种基于大数据分析的数字化管理方法及系统
数字化管理方法 语义 乘法器 序列 子系统
2
基于多模态胶囊网络进行影像融合的土地覆盖分类方法及系统
合成孔径雷达影像 土地覆盖分类方法 胶囊网络模型 多模态 残差结构
3
一种基于AR辅助的车架支架安装情况检测方法、计算机系统及计算机可读存储介质
车架支架 分支 语义 融合特征 三维点云数据
4
一种基于AI技术的固体废物堆场远程巡航及隐患识别系统
固体废物堆场 多源监测数据 可见光图像 渗滤液 识别系统
5
基于自适应学习的跨语言资讯数据采集与结构化处理方法
协方差矩阵 元学习策略 语义 线性分类器 动态特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号