摘要
本发明公开了一种基于层次跨模态注意力融合的焦虑障碍检测系统,应用于焦虑障碍检测技术领域,包括:模态特征编码模块:基于预训练的BERT模型提取患者文本的全局语义特征;通过堆叠双层双向长短时记忆网络捕捉患者音频特征的时序动态特性和上下文依赖信息;基于深度卷积神经网络提取患者发言视频的深层视频特征;分层跨模态注意力融合模块:基于层次化双向注意力融合策略,分别进行文本和音频模态特征的双向注意力交互融合及融合结果与视频模态特征的双向注意力交互融合;残差增强多层感知器分类决策模块:输入多模态融合特征至基于残差增强结构的多层感知器分类决策模型,得到焦虑障碍检测结果。本发明有效提高了焦虑障碍检测精度。
技术关键词
模态特征
双向注意力
障碍检测系统
多头注意力机制
跨模态
文本
多层感知器
焦虑
融合策略
音频特征
融合特征
语义特征
视频
深度卷积神经网络
多模态
障碍检测技术
患者
编码模块
系统为您推荐了相关专利信息
喷涂机器人
喷涂方法
裂缝
时序特征
并行特征提取