摘要
本发明属于疲劳驾驶检测技术领域,具体涉及一种大模型提示词多尺度时空特征融合疲劳驾驶检测方法,该方法利用预训练大模型生成对应提示词并提取提示词的语义嵌入向量,然后对输入混合专家模型的视频帧多尺度采样,将提示词特征与各尺度视频序列通道级联,融合多尺度特征生成微表情时空运动特征图,并输入轻量化Transformer网络,结合动态更新的综合学习向量,通过分类器输出疲劳概率,基于阈值预警判断是否疲劳驾驶,最后使用交叉熵损失函数结合优化器对混合专家模型进行训练。该方法能够全面捕捉驾驶员面部表情细微变化,并通过大模型提示词引导,高效建模时空运动特征,为车辆驾驶员疲劳驾驶检测提供了一种高效、精准的解决方案。
技术关键词
疲劳驾驶检测方法
运动特征
疲劳驾驶检测技术
词特征
驾驶员面部表情
序列
融合多尺度特征
分类器
驾驶员疲劳驾驶
级联
视频帧
生成训练样本
生成提示词
衰减技术
双线性插值
编码系统
通道
语义