摘要
本发明公开了一种设备不变性增强的多模态深度学习模型及其应用,包括输入模块、编码模块、模态融合模块、分类模块、设备对抗分支模块、输出模块和最终总损失函数,咳嗽音频张量和症状描述及人口学文本信息经输入模块转化为向量后,经编码模块提取特征得到音频特征和文本特征;音频特征和文本特征经模态融合模块处理得到最终联合表征后,由分类模块处理得到分类结果及相应概率并由输出模块输出;设备对抗分支模块在训练阶段使音频编码器对抗设备分类头;最终总损失函数在训练阶段引入以优化模型。本发明的模型具有在不依赖特定品牌采集设备的前提下,对多种呼吸系统疾病实现高准确识别的能力,在多设备、多中心数据中展现出色的泛化性能与鲁棒性。
技术关键词
音频编码器
深度学习模型
音频特征
采集设备
池化特征
呼吸系统疾病
多模态交互
AI辅助诊断系统
多头注意力机制
编码模块
设备识别
文本编码器
多标签
分支
样本
输入模块
系统为您推荐了相关专利信息
车辆异常检测方法
深度学习模型
车辆三维模型
策略
计算机程序产品
电池状态数据
健康状态参数
数字孪生
优化控制方法
门控循环单元网络
程度识别方法
残差网络
抑郁
预训练模型
引入注意力机制
前馈神经网络
随机梯度下降
数值
半圆形
印刷电路板换热器