基于多模态大模型提高模型图片识别能力的方法

正文

推荐专利

申请号：CN202510995517

申请日期：2025-07-18

公开号：CN120833540A

公开日期：2025-10-24

类型：发明专利

摘要

本发明公开了基于多模态大模型提高模型图片识别能力的方法，涉及图像识别技术领域，搭建多模态大模型的基础架构，并利用海量图片训练多模态大模型作为基础模型；收集新增的图像，结合图像准备对应的标准问题和描述图片内容的答案；根据图片识别任务需求，设计相应的指令，即提示词，引导大模型进行图片识别。本发明多模态大模型使用海量的图片进行训练，应用到图片识别领域可充分利用多模态大模型的图片特征库来优化图片识别技术的准确率，且通过使用多模态大模型的微调训练，可大幅度减少训练图片数量级，通过进行复合式的微调训练后，多模态大模型可具备泛化所训练图片的识别能力，可以大幅减少需要用于训练的图片数量。

技术关键词

多模态指令答案数据文本图片识别技术场景基础质检工具脚本分布式训练参数编码器图像识别技术样本预训练模型验证机制解码器

系统为您推荐了相关专利信息

一种新型放射性成像方法与系统

放射性成像方法高性能计算机直线加速器非瞬时性计算机存储介质光信号

一种基于GEE的叶面积指数遥感产品空间降尺度方法

地表反射率遥感产品叶面积指数空间降尺度方法机器学习模型

基于蚁群算法的建筑施工路径优化方法

路径优化方法蚁群算法动态调整机制实时数据机器学习方法

基于AI大模型的财务领域数据智能对话式分析系统

分析系统财务归因指标自然语言解析

一种基于智能算法的文物藏品检索系统

文物藏品检索系统智能算法数据存储模块马尔可夫模型

基于多模态大模型提高模型图片识别能力的方法

站点导航

APP 下载