一种结合MFCC和时域统计特征的音频质量自动评分方法及系统

AITNT
正文
推荐专利
一种结合MFCC和时域统计特征的音频质量自动评分方法及系统
申请号:CN202511516445
申请日期:2025-10-23
公开号:CN120998235A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种结合MFCC和时域统计特征的音频质量自动评分方法及系统,包括:在参考与待测信号重采样与时间对齐基础上,按秒分段并进一步按100 ms子段提取倒谱与时域统计特征,通过对子段特征进行均值+最大值的层级聚合形成170维秒级特征,并与对应参考段拼接为340维联合特征,输入预训练的支持向量机模型输出0到5的逐秒离散评分,从而在轻量算力与小样本条件下实现高时间分辨率的自动化质量评估与异常定位。
技术关键词
时域统计特征 自动评分方法 自动评分系统 音频信号重采样 梅尔频率倒谱系数 频域特征 MFCC特征 高时间分辨率 支持向量机模型 SVM分类 离散余弦变换 正则化参数 分段 特征提取模块 样本 计算机 处理器 指令 输入模块
系统为您推荐了相关专利信息
1
PPG大数据驱动下的生物特征识别方法
梅尔频率倒谱系数 认证向量 低通滤波器参数 通用背景模型 生物特征识别方法
2
音频驱动数字人的方法、装置、设备及存储介质
融合人脸 关键点 音频特征 梅尔频率倒谱系数 轮廓特征
3
背景音乐生成与同步方法、装置、设备及存储介质
视频 同步方法 音乐 动作特征 曲线
4
一种基于FPGA的IP核模块调试方法
高维特征向量 调试方法 IP核 去噪电路 模块
5
一种基于人工智能的语音识别方法及系统
语音识别方法 像素点 梅尔频率倒谱系数 图像特征向量 语音特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号