基于语音与表情特征多模态融合的AD筛查方法

正文

推荐专利

申请号：CN202510827419

申请日期：2025-06-20

公开号：CN120954741A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了基于语音与表情特征多模态融合的AD筛查方法，涉及计算机视觉与医疗诊断技术领域。包括：对人脸图像数据进行关键帧提取、人脸检测与筛选，以及图像标准化处理；同时对语音数据进行滤波器组Fbank特征提取；对于语音模态，利用局部和全局特征融合模块提取语音特征，对于人脸模态，通过多阶动态特征交互网络捕捉时序信息，结合自适应层级注意力融合模块突出重要特征，并通过判别式嵌入生成模块提升特征的判别性；对各模态数据独立进行特征提取和分类标签预测，通过深度强化学习动态优化特征提取路径；根据各模态的置信度分数，采用加权平均、贝叶斯融合或深度置信网络等融合策略，整合语音和人脸表情图像的特征信息，生成最终的分类决策。

技术关键词

表情特征筛查方法多模态人脸表情图像语音特征全局特征融合深度置信网络人脸图像数据深度强化学习注意力置信度计算方法分类边界交互网络计算机视觉库融合策略医疗诊断技术人脸检测器动态

系统为您推荐了相关专利信息

一种多模态融合的玉米收获机割台高度自适应调节方法及系统

玉米收获机割台液压执行机构 PID控制算法双目相机深度图

一种基于AI多模态的智能单兵系统

智能单兵系统智能分析模块门控循环单元动态权重优化多模态数据采集

语音分离方法、系统、车辆及存储介质

语音编码图像编码信号序列音频采集装置

一种基于驾驶员视觉特征融合的危险行为预警方法

融合特征视觉特征预警方法多模态数据

面向多角色场景的智能服务验证系统及差异化评估方法

面向多角色服务验证系统 TensorFlow框架多模态交互多智能体协作

基于语音与表情特征多模态融合的AD筛查方法

站点导航

APP 下载