摘要
本发明公开了基于无监督预训练和多模态大模型的交通事故识别方法,包括如下步骤:S1、搜集整理交通监控场景中的视频数据,选取无交通事故发生的视频片段为数据样本,提取视频关键帧,进行掩码自编码器的无监督预训练,重建被随机遮挡的视频片段;S2、计算原始视频与重建视频之间的重建误差评估重建质量,筛选出重建质量较差的关键帧视频片段;本发明通过掩码自编码器的无监督训练,即使在标注数据有限的情况下,也能够过滤较多的无交通事故片段,快速筛选出可能存在交通异常事件的视频片段,通过构建多模态交通数据对多模态大模型的微调训练,能够提升交通事故在复杂场景下的识别准确率和效率,提供实时警报和详细分析,及时采取应对措施。
技术关键词
重建误差
识别方法
无监督
交通监控场景
编码器
关键帧
视频分析
数据
异常事件
动态变化规律
注意力机制
视频帧
多模态
多层感知机
表达式
视觉
图像分割