摘要
本发明属于施工安全检查相关技术领域,具体涉及一种基于多模态大语言模型的施工现场安全检查方法,包括:引入多模态大语言模型,结合包含有安全标准规范和评估规则的知识库,多次应用多模态大语言模型,具体为:由图像和预设的视觉感知系统提示文本,得到图像内容描述;由用户输入查询、图像内容描述和预设的任务分解系统提示,将用户输入查询智能分解为多个子查询任务;向施工安全知识库搜索与每子查询相关的施工安全管理标准数据,基于图像内容描述,结合搜索到的标准数据,对该子查询进行分析推理,得到该子查询的推理与结论;最后基于各子查询数据得出总的推理与结论。本发明能准确、科学、全面地实现施工现场安全检查。
技术关键词
安全检查方法
大语言模型
施工现场
视觉感知系统
文本
语义
多模态
分支
多层感知器网络
输出图像内容
搜索模块
图片
推理系统
可读存储介质
处理单元
关键词
场景
指令
分块
系统为您推荐了相关专利信息
术语
文本翻译方法
文本翻译系统
光学字符识别技术
翻译装置
智能数据采集分析
中心服务器
网络连接状态
管道施工现场
数据采集单元