摘要
本发明公开了一种基于预训练模型和图神经网络的咳嗽声识别方法,属于人工智能辅助诊断领域。该方法具体包括:构建包含咳嗽声与非咳嗽声的音频数据集;对音频数据进行静音去除,然后按照固定长度分割成咳嗽声、非咳嗽声片段;对声音片段按照一定帧长、帧移分帧,每帧音频利用预训练模型提取特征;以音频片段每帧特征为图中结点生成节点特征矩阵,以不同帧之间的关系构建邻接矩阵,生成音频片段图数据;对咳嗽、非咳嗽片段图数据按照一定比例划分训练测试集,将图数据输入图神经网络模型中,对图神经网络模型训练,利用训练后的图神经网络模型对咳嗽声进行识别。本发明的方法,利用图神经网络技术,根据输入数据的特性灵活的学习不同时间段和频率段的相关性,提高模型的表达能力,实现更高精度的咳嗽声识别。
技术关键词
预训练模型
识别方法
音频
神经网络模型训练
节点特征
咳嗽
数据
嵌入特征
人工智能辅助
神经网络技术
矩阵
麦克风
结点
场景
关系
注意力
时间段
系统为您推荐了相关专利信息
防鸟罩
绝缘子
绝缘套
机器学习模型
音频采集模块
快速检测系统
电化学传感器
数值计算方法
数据采集模块
特征值
表征学习方法
特征提取模块
嵌入特征
语义
描述符