摘要
本发明公开了基于多模态大模型提高模型图片识别能力的方法,涉及图像识别技术领域,搭建多模态大模型的基础架构,并利用海量图片训练多模态大模型作为基础模型;收集新增的图像,结合图像准备对应的标准问题和描述图片内容的答案;根据图片识别任务需求,设计相应的指令,即提示词,引导大模型进行图片识别。本发明多模态大模型使用海量的图片进行训练,应用到图片识别领域可充分利用多模态大模型的图片特征库来优化图片识别技术的准确率,且通过使用多模态大模型的微调训练,可大幅度减少训练图片数量级,通过进行复合式的微调训练后,多模态大模型可具备泛化所训练图片的识别能力,可以大幅减少需要用于训练的图片数量。
技术关键词
多模态
指令
答案
数据
文本
图片识别技术
场景
基础
质检工具
脚本
分布式训练
参数
编码器
图像识别技术
样本
预训练模型
验证机制
解码器
系统为您推荐了相关专利信息
放射性成像方法
高性能计算机
直线加速器
非瞬时性计算机存储介质
光信号
地表反射率
遥感产品
叶面积指数
空间降尺度方法
机器学习模型
路径优化方法
蚁群算法
动态调整机制
实时数据
机器学习方法
文物藏品
检索系统
智能算法
数据存储模块
马尔可夫模型