基于多模态大模型提高模型图片识别能力的方法

AITNT
正文
推荐专利
基于多模态大模型提高模型图片识别能力的方法
申请号:CN202510995517
申请日期:2025-07-18
公开号:CN120833540A
公开日期:2025-10-24
类型:发明专利
摘要
本发明公开了基于多模态大模型提高模型图片识别能力的方法,涉及图像识别技术领域,搭建多模态大模型的基础架构,并利用海量图片训练多模态大模型作为基础模型;收集新增的图像,结合图像准备对应的标准问题和描述图片内容的答案;根据图片识别任务需求,设计相应的指令,即提示词,引导大模型进行图片识别。本发明多模态大模型使用海量的图片进行训练,应用到图片识别领域可充分利用多模态大模型的图片特征库来优化图片识别技术的准确率,且通过使用多模态大模型的微调训练,可大幅度减少训练图片数量级,通过进行复合式的微调训练后,多模态大模型可具备泛化所训练图片的识别能力,可以大幅减少需要用于训练的图片数量。
技术关键词
多模态 指令 答案 数据 文本 图片识别技术 场景 基础 质检工具 脚本 分布式训练 参数 编码器 图像识别技术 样本 预训练模型 验证机制 解码器
系统为您推荐了相关专利信息
1
一种新型放射性成像方法与系统
放射性成像方法 高性能计算机 直线加速器 非瞬时性计算机存储介质 光信号
2
一种基于GEE的叶面积指数遥感产品空间降尺度方法
地表反射率 遥感产品 叶面积指数 空间降尺度方法 机器学习模型
3
基于蚁群算法的建筑施工路径优化方法
路径优化方法 蚁群算法 动态调整机制 实时数据 机器学习方法
4
基于AI大模型的财务领域数据智能对话式分析系统
分析系统 财务 归因 指标 自然语言解析
5
一种基于智能算法的文物藏品检索系统
文物藏品 检索系统 智能算法 数据存储模块 马尔可夫模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号