摘要
本发明公开了一种电力维修场景下的流式语音识别方法及系统,属于语音识别技术领域,包括收集包含电力系统维护场景的语音数据;对所述语音数据进行预处理并标注,得到标注的语音数据;对标注后的语音数据进行分段处理,提取每段语音数据的动态特征和静态特征,将所述动态特征和静态特征拼接后作为每段语音数据的特征向量;将每段语音数据的特征向量输入至流式语音识别模型进行训练,得到训练好的电力场景下的流式语音识别模型;获取当前语音数据,对当前语音数据进行识别。通过构建并训练流式语音识别模型提高语音识别的实时性,并且还通过结合静态特征和动态特征可以捕捉更多语音信号的细节和变化,提高语音识别模型的准确性和鲁棒性。
技术关键词
流式语音识别方法
语音识别模型
静态特征
梅尔频率倒谱系数
电力系统维护
场景
动态
估计噪声功率
短时傅里叶变换
语音识别系统
分段
语音识别技术
离散余弦变换
模型训练模块
特征提取模块
数据获取模块
数据处理模块
系统为您推荐了相关专利信息
语音情感识别方法
MFCC特征
情感类别
Softmax函数
前馈神经网络
时空融合特征
静态特征
残差网络
长短期记忆网络
加权特征
智能语音系统
信息提取模型
语音识别模型
联合损失函数
数据存储