摘要
本申请提出了一种用于安全风险识别的多模态大模型构建方法,包括以下步骤:构建校园安全多模态数据集,将监控视频数据的监控图像映射为图像特征序列,将对应当前监控视频数据的环境传感器数据、设施维护数据以及安全反馈数据转换为文本特征序列;对图像特征序列和文本特征序列进行多模态感知流式处理以及空间语义对齐得到同一组多模态输入序列;使用多模态输入序列对生成式transformer模型的解码器进行微调得到安全风险识别模型。本方案通过构建包含监控视频、环境传感器等多源数据的校园安全多模态数据集,并结合生成式 Transformer 模型进行微调从而得到安全风险识别模型,从而使用安全风险识别模型来实现对校园安全风险的精准识别与高效定位。
技术关键词
模型构建方法
环境传感器数据
风险识别模型
多模态
序列
跨模态
文本
图像
注意力
分块
语义
层级
视频
设施
文字特征
校园
编码特征
系统为您推荐了相关专利信息
知识提取方法
实体命名识别
铝合金材料
长短记忆网络
门控循环单元
电力设备信息
电力设备运行信息
工作特征
频谱特征
工作状态信息
语句
数据查询方法
缓存系统
解析器
计算机可读指令
负荷预测模型
工业园区
时序结构
负荷预测方法
计算机可读指令