摘要
本发明公开了一种言语香蕉图的构建方法及装置,通过系统化的语音数据处理和优化的可视化分析,能够全面展现语音信号的频率与声压级分布特性,特别在语音识别、听觉感知研究以及听力学分析等领域具有广泛的应用潜力。本发明的方法涵盖了音频数据准备、标注文件生成、听域曲线校正、声学特征提取与数据可视化等关键步骤。涵盖了音频数据准备、标注文件生成、听域曲线校正、声学特征提取与数据可视化等关键步骤,应用听域曲线校正机制,使声压级分布符合人耳的听觉感知,为语音分析及听力学研究提供有效支持。将自动化与交互式处理相结合,结合中文音频样本,提高了言语香蕉图中数据质量和分析效率。
技术关键词
香蕉
高斯混合模型
频率
数据可视化
语音
期望最大化算法
预测编码方法
音频处理单元
曲线
特征提取单元
校正机制
声学特征
功率
插值方法
协方差矩阵
校正单元
坐标系