摘要
本公开涉及属于质谱数据分析技术领域,特别涉及基于K‑均值聚类算法的质谱气体来源解析方法及系统。所述方法包括:获取原始质谱时序数据并预处理,得到标准化质谱矩阵;对标准化质谱矩阵特征工程优化,得到低维特征空间矩阵;通过聚类算法处理低维特征空间矩阵,得到聚类标签向量和质心特征向量;基于污染源数据库,通过聚类标签向量和质心特征向量进行污染源指纹匹配并分析。本公开通过非对称最小二乘法进行基线校正,消除基线漂移和背景噪声的干扰,确保了信号的准确性,通过Savitzky‑Golay滤波器平滑数据,去除高频噪声,保留了质谱信号的关键特征,采用动态时间规整算法进行峰对齐,解决了不同样本间的时间偏移问题,使得特征峰能够正确对齐。
技术关键词
来源解析方法
均值聚类算法
质谱
协方差矩阵
特征工程
动态时间规整算法
气体
加权欧氏距离
解析系统
标签
时序
噪声滤波
K‑均值聚类
轮廓系数
数值优化算法
特征值
基线