一种基于多模态和深度学习的呼吸音电子听诊信号识别方法

正文

推荐专利

申请号：CN202411664466

申请日期：2024-11-20

公开号：CN119622505A

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了一种基于多模态和深度学习的呼吸音电子听诊信号识别方法，涉及深度学习和多模态学习技术领域。首先获取与呼吸声音分类相关的音频数据及其对应的文本描述；然后对音频数据进行预处理，包括去噪和特征提取；接着通过对比学习方法，将音频样本与生成的文本描述进行匹配，从而优化模型的表示能力；再对训练好的模型进行评估和验证，利用分类头对音频样本进行标签预测；最后采用多模态融合的方法，将元数据与音频特征结合，通过推理阶段进行分类预测。本发明在关注模型分类准确性的基础上，同时关注模型的多模态输入效果，通过整合元数据提升模型的鲁棒性，验证在缺失部分元数据的情况下，模型是否依然能保持良好的分类性能。此外，该方法还揭示了不同元数据对模型预测结果的重要性及其相互作用关系。综上所述，该发明可以为临床应用提供可靠的支持。

技术关键词

信号识别方法多模态数据音频特征电子识别模型训练短时傅里叶变换 BERT模型特征提取模型听诊设备音频编码器文本编码器训练集通道学习方法网络结构格式分类器

系统为您推荐了相关专利信息

基于信号变化速率的电能计量窗口自适应调节方法及装置

电能速率信号频率序列

一种多模态数据融合的健康监测分析预警方法及系统

分析预警方法多模态数据融合生理心率短时傅里叶变换

抬头显示系统控制方法、装置、电子设备及存储介质

抬头显示系统显示系统控制方法坐标系眼睛显示系统控制装置

基于贝叶斯神经网络的青藏高原土性参数标准值计算方法

贝叶斯神经网络标准值计算方法青藏高原马尔科夫链蒙特卡洛方法土体物理性质

基于潜在语义优化的营销文案迭代生成方法、装置及介质

语义向量迭代生成方法创意性预训练语言模型数据存储区域

一种基于多模态和深度学习的呼吸音电子听诊信号识别方法

站点导航

APP 下载