基于视觉语言大模型的施工现场隐患识别方法及系统

AITNT
正文
推荐专利
基于视觉语言大模型的施工现场隐患识别方法及系统
申请号:CN202510952390
申请日期:2025-07-10
公开号:CN120808348A
公开日期:2025-10-17
类型:发明专利
摘要
本申请涉及一种基于视觉语言大模型的施工现场隐患识别方法及系统。所述方法包括:获取实时采集的施工现场高处作业的图像数据;对图像数据进行预处理,得到待检测图像;将待检测图像输入到施工安全视觉语言模型中,得到隐患识别结果;隐患识别结果包括高处坠落安全隐患类型和规范自然语言图像字幕。采用本方法能够为施工现场安全管理提供了智能化的技术支持,通过对施工现场高处坠落隐患识别和生成规范化的图像字幕,有效降低高处坠落事故的发生率。
技术关键词
自然语言 施工现场 多任务联合训练 高处坠落隐患 视觉 术语 字幕 数据 矩阵 多尺度 适配器 文本编码器 图像编码器 识别方法 感知哈希算法 训练语言模型 同义词 场景结构
系统为您推荐了相关专利信息
1
视频剪辑方法及装置
模态分析 视频剪辑方法 多模态 视频剪辑装置 逻辑
2
一种基于状态空间模型的红外无人机群检测方法
特征提取模块 状态空间模型 网络 物体检测 损失函数设计
3
一种基于深度学习的交通地理信息数据处理方法及系统
交通地理信息 坐标系 数据处理方法 坐标转换算法 预测交通流量
4
一种三维视觉与红外热成像联合标定方法、系统及介质
联合标定方法 红外响应材料 红外热成像仪 非线性映射关系 视觉相机
5
一种基于RetinaNet算法的钢铁长材图像垛位目标检测和自动排序方法
自动排序方法 钢材堆垛 钢铁 算法 自动盘库
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号