基于语音与表情特征多模态融合的AD筛查方法

AITNT
正文
推荐专利
基于语音与表情特征多模态融合的AD筛查方法
申请号:CN202510827419
申请日期:2025-06-20
公开号:CN120954741A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了基于语音与表情特征多模态融合的AD筛查方法,涉及计算机视觉与医疗诊断技术领域。包括:对人脸图像数据进行关键帧提取、人脸检测与筛选,以及图像标准化处理;同时对语音数据进行滤波器组Fbank特征提取;对于语音模态,利用局部和全局特征融合模块提取语音特征,对于人脸模态,通过多阶动态特征交互网络捕捉时序信息,结合自适应层级注意力融合模块突出重要特征,并通过判别式嵌入生成模块提升特征的判别性;对各模态数据独立进行特征提取和分类标签预测,通过深度强化学习动态优化特征提取路径;根据各模态的置信度分数,采用加权平均、贝叶斯融合或深度置信网络等融合策略,整合语音和人脸表情图像的特征信息,生成最终的分类决策。
技术关键词
表情特征 筛查方法 多模态 人脸表情图像 语音特征 全局特征融合 深度置信网络 人脸图像数据 深度强化学习 注意力 置信度计算方法 分类边界 交互网络 计算机视觉库 融合策略 医疗诊断技术 人脸检测器 动态
系统为您推荐了相关专利信息
1
一种多模态融合的玉米收获机割台高度自适应调节方法及系统
玉米收获机割台 液压执行机构 PID控制算法 双目相机 深度图
2
一种基于AI多模态的智能单兵系统
智能单兵系统 智能分析模块 门控循环单元 动态权重优化 多模态数据采集
3
语音分离方法、系统、车辆及存储介质
语音编码 图像编码 信号 序列 音频采集装置
4
一种基于驾驶员视觉特征融合的危险行为预警方法
融合特征 视觉特征 预警方法 多模态 数据
5
面向多角色场景的智能服务验证系统及差异化评估方法
面向多角色 服务验证系统 TensorFlow框架 多模态交互 多智能体协作
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号