摘要
本申请提供一种多模态大模型的处理方法、设备、存储介质和程序产品,其中方法包括:获取监控场景的原始图像集;识别所述原始图像集中目标对象的特征信息;根据所述特征信息,生成所述原始图像集对应的问答对;将所述原始图像集和对应的所述问答对作为训练数据,对预训练的多模态大模型进行微调训练,得到与所述监控场景适配的目标多模态大模型。本申请实现了使多模态大模型更好地适应特定监控场景的需求,提升了多模态大模型在监控场景下的性能表现和应用效果,进而提高可以提高监控系统的智能化水平。
技术关键词
大语言模型
多模态
视觉特征
对象
计算机执行指令
视频背景
答案
人体
数据
场景
信息识别方法
样本
处理器
可读存储介质
标记
文本
图像组合
系统为您推荐了相关专利信息
家庭
环境感知信息
分层
分布式架构
早期风险预警