基于视觉语言大模型的施工现场隐患识别方法及系统

正文

推荐专利

申请号：CN202510952390

申请日期：2025-07-10

公开号：CN120808348A

公开日期：2025-10-17

类型：发明专利

摘要

本申请涉及一种基于视觉语言大模型的施工现场隐患识别方法及系统。所述方法包括：获取实时采集的施工现场高处作业的图像数据；对图像数据进行预处理，得到待检测图像；将待检测图像输入到施工安全视觉语言模型中，得到隐患识别结果；隐患识别结果包括高处坠落安全隐患类型和规范自然语言图像字幕。采用本方法能够为施工现场安全管理提供了智能化的技术支持，通过对施工现场高处坠落隐患识别和生成规范化的图像字幕，有效降低高处坠落事故的发生率。

技术关键词

自然语言施工现场多任务联合训练高处坠落隐患视觉术语字幕数据矩阵多尺度适配器文本编码器图像编码器识别方法感知哈希算法训练语言模型同义词场景结构

系统为您推荐了相关专利信息

视频剪辑方法及装置

模态分析视频剪辑方法多模态视频剪辑装置逻辑

一种基于状态空间模型的红外无人机群检测方法

特征提取模块状态空间模型网络物体检测损失函数设计

一种基于深度学习的交通地理信息数据处理方法及系统

交通地理信息坐标系数据处理方法坐标转换算法预测交通流量

一种三维视觉与红外热成像联合标定方法、系统及介质

联合标定方法红外响应材料红外热成像仪非线性映射关系视觉相机

一种基于RetinaNet算法的钢铁长材图像垛位目标检测和自动排序方法

自动排序方法钢材堆垛钢铁算法自动盘库

基于视觉语言大模型的施工现场隐患识别方法及系统

站点导航

APP 下载