摘要
本发明公开了一种基于多模态的驾驶员情绪检测的方法,包括如下步骤:S1、通过摄像头和麦克风实时采集驾驶员的面部视频和语音数据;S2、利用mediapipe提取面部视频中的关键点,并且计算面部皮肤区域的RGB均值,通过POS模型计算心率变异值,利用散射变换方法处理信号,提取心率变异特征,使用mediapipe进行面部检测,提取面部区域图像,将面部区域图像resize到resnet18模型所需的大小,利用resnet18模型提取面部表情特征,利用opensmile框架提取语音特征,使用config/is09‑13/IS09_emotion.conf配置文件;S3、将生理特征、面部表情特征和语音情绪特征输入多模态融合模型,评估驾驶员的情绪状态。本发明设计驾驶员在驾驶过程中的情绪状态检测,特别是利用了人工智能对驾驶员面部、语音以及生理指标变化的情绪检测方法。
技术关键词
驾驶员情绪检测
情绪特征
多模态
融合特征
时间卷积网络
音频
实时图像
时序特征
麦克风
语音
多维特征向量组合
矩阵
特征融合网络
心率
驾驶员面部
面部表情特征提取
面部关键点