摘要
本发明公开了一种基于多模态融合的人脸识别方法,属于人脸识别技术领域,本发明中,当遇到面部部分遮挡或强光照射导致视觉信息缺失时,语音信号中的情感特征能够自动补偿视觉信息的不足。例如在视频通话场景中,当用户用手遮挡下巴区域时,系统通过分析语音中的语调颤抖特征,结合未被遮挡的眉眼区域肌肉运动,依然能准确识别出焦虑情绪,避免因局部信息缺失造成的误判。同时,在嘈杂背景声干扰语音的情况下,模型通过捕捉面部微表情的持续时长与强度变化,例如持续3秒以上的嘴角轻微抽动,能够有效过滤语音噪声的干扰,维持情感判断的准确性。
技术关键词
人脸识别方法
多模态
神经网络剪枝
跨模态
语音
层次化分类体系
视频通话场景
动态时间规整算法
干扰抑制模块
消除环境噪声
模态特征
人脸特征
低比特量化
时序特征
通道注意力机制
时间卷积网络
深度残差网络
系统为您推荐了相关专利信息
路径规划方法
稀疏有向图
结构构建方法
地理位置信息
算法
林木病虫害
松树线虫病
多模态融合深度学习
定位方法
时间序列信息
精准识别方法
钳夹阴道
多模态
腔镜穿刺器
切口保护器
工作负荷评估方法
心率
贝叶斯网络模型
面部表情特征
感官