摘要
本申请涉及数字图像处理技术领域,尤其涉及一种基于大模型的施工机械检测方法。由于在本申请实施例中,基于目标检测小模型确定视频中的每个待检测图像帧中是否存在施工机械,若连续第一数量的待检测图像帧中存在施工机械的目标图像帧的第二数量大于数量阈值,则基于多模态大模型对该目标图像帧进行检测,确定目标图像帧中是否存在施工机械,若存在,则输出告警信息。只有目标检测小模型在连续第一数量的待检测图像帧中检测到了多个存在施工机械的目标图像帧,才利用多模态到模型对目标图像帧进行识别,可以有效地过滤掉目标检测小模型偶然的误检情况,进而提高施工机械检测的准确率。
技术关键词
施工机械
多模态
输出告警信息
样本
文本编码器
多层感知器
置信度阈值
矩阵
数字图像处理技术
排序策略
序列
数据
视频
分辨率
图文
指令
标识
系统为您推荐了相关专利信息
鞋类产品
外观缺陷检测系统
运算服务器
硬件系统
图像采集机构
样本
风险评估报告
监测系统
传感器模块
构建分类模型
激光雷达点云数据
交互特征
运动特征
轨迹预测方法
动态障碍物
图像配准模型
特征提取模块
医学图像配准方法
校正模块
子模块