多模态大模型的处理方法、设备、存储介质和程序产品

正文

推荐专利

申请号：CN202411865413

申请日期：2024-12-18

公开号：CN119314117B

公开日期：2025-09-12

类型：发明专利

摘要

本申请提供一种多模态大模型的处理方法、设备、存储介质和程序产品，其中方法包括：获取监控场景的原始图像集；识别所述原始图像集中目标对象的特征信息；根据所述特征信息，生成所述原始图像集对应的问答对；将所述原始图像集和对应的所述问答对作为训练数据，对预训练的多模态大模型进行微调训练，得到与所述监控场景适配的目标多模态大模型。本申请实现了使多模态大模型更好地适应特定监控场景的需求，提升了多模态大模型在监控场景下的性能表现和应用效果，进而提高可以提高监控系统的智能化水平。

技术关键词

大语言模型多模态视觉特征对象计算机执行指令视频背景答案人体数据场景信息识别方法样本处理器可读存储介质标记文本图像组合

系统为您推荐了相关专利信息

表面缺陷检测方法验证缺陷对象视觉参数

交互特征意图交互方法画像动作表情

梳齿电极加速度测量方法微机械多模态谐振子

大语言模型推理方法图片数据超参数

家庭环境感知信息分层分布式架构早期风险预警

多模态大模型的处理方法、设备、存储介质和程序产品

站点导航

APP 下载