一种设备不变性增强的多模态深度学习模型及其应用

正文

推荐专利

申请号：CN202511485464

申请日期：2025-10-17

公开号：CN120954690A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种设备不变性增强的多模态深度学习模型及其应用，包括输入模块、编码模块、模态融合模块、分类模块、设备对抗分支模块、输出模块和最终总损失函数，咳嗽音频张量和症状描述及人口学文本信息经输入模块转化为向量后，经编码模块提取特征得到音频特征和文本特征；音频特征和文本特征经模态融合模块处理得到最终联合表征后，由分类模块处理得到分类结果及相应概率并由输出模块输出；设备对抗分支模块在训练阶段使音频编码器对抗设备分类头；最终总损失函数在训练阶段引入以优化模型。本发明的模型具有在不依赖特定品牌采集设备的前提下，对多种呼吸系统疾病实现高准确识别的能力，在多设备、多中心数据中展现出色的泛化性能与鲁棒性。

技术关键词

音频编码器深度学习模型音频特征采集设备池化特征呼吸系统疾病多模态交互 AI辅助诊断系统多头注意力机制编码模块设备识别文本编码器多标签分支样本输入模块

一种设备不变性增强的多模态深度学习模型及其应用

站点导航

APP 下载