摘要
本发明公开了电力施工安全管理方法、装置、设备及介质,属于数据处理技术领域,通过视觉语言模型识别当前施工现场图像数据,输出动态描述文本以及场景文本,与预先获取的违规操作描述文本进行比对,进而判断是否存在违规操作。由于本发明的训练和识别过程不需要考虑事故原因或是事故概率,仅进行类似看图说话的识别,因此算力要求较低,识别效率和准确性较高,并且将图像信息转化为不同文本进行分别对比以降低复杂性,减少信息传递损失,进一步降低对比难度和算力要求,将安全管理中的风险识别聚焦在违规操作方面,实现事半功倍的安全风险识别效果。
技术关键词
管理方法
施工现场
电力
人机交互设备
动态
跨模态
计算机可执行指令
文本编码器
图像
视觉
现场设备
风险
NLP技术
机器学习算法
数据处理技术
项目
生成场景