摘要
本发明公开了一种基于人工智能的语音处理方法,属于语音识别技术领域。本发明首先将语音信号划分为多个短时帧,通过过零率标记出平稳段和扰动段;随后提取平稳段‑平稳段、平稳段‑扰动段、扰动段‑平稳段及扰动段‑扰动段这四种组合;针对每个组合,提取基频迁移比、谐波重心迁移比、谱带宽迁移比和功率谱迁移比,构建相应的迁移比特征矩阵;接着计算各组合迁移比特征矩阵中每列特征与存储特征的相似系数并取均值,得到特征匹配向量;最后利用多通道‑BP神经网络处理上述4个组合的迁移比特征矩阵和特征匹配向量,实现说话人身份识别。本发明通过精细化的特征提取与组合处理,有效提升了语音识别的精度。
技术关键词
卷积特征
BP神经网络
谐波
说话人身份识别
功率
输入端
矩阵
存储特征
多通道
信号
乘法器
语音识别技术
积层
输出端
压缩特征
标记
元素
频率
系统为您推荐了相关专利信息
参数优化方法
送端换流站
海上风力发电场
控制器
三相电网电压
标定方法
发动机燃油经济性
喷油提前角
高原
缩短产品开发时间
Adam算法
前馈神经网络
检测头
阶段
注意力编码器
分类服装
服装类别
服装分类系统
决策树模型
服装分类方法