一种电力维修场景下的流式语音识别方法及系统

正文

推荐专利

申请号：CN202411090688

申请日期：2024-08-09

公开号：CN118782023A

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开了一种电力维修场景下的流式语音识别方法及系统，属于语音识别技术领域，包括收集包含电力系统维护场景的语音数据；对所述语音数据进行预处理并标注，得到标注的语音数据；对标注后的语音数据进行分段处理，提取每段语音数据的动态特征和静态特征，将所述动态特征和静态特征拼接后作为每段语音数据的特征向量；将每段语音数据的特征向量输入至流式语音识别模型进行训练，得到训练好的电力场景下的流式语音识别模型；获取当前语音数据，对当前语音数据进行识别。通过构建并训练流式语音识别模型提高语音识别的实时性，并且还通过结合静态特征和动态特征可以捕捉更多语音信号的细节和变化，提高语音识别模型的准确性和鲁棒性。

技术关键词

流式语音识别方法语音识别模型静态特征梅尔频率倒谱系数电力系统维护场景动态估计噪声功率短时傅里叶变换语音识别系统分段语音识别技术离散余弦变换模型训练模块特征提取模块数据获取模块数据处理模块

系统为您推荐了相关专利信息

基于多尺度CNN和Transformer融合的语音情感识别方法

语音情感识别方法 MFCC特征情感类别 Softmax函数前馈神经网络

一种基于深度一致性约束的语义动态SLAM处理方法

静态特征关键帧场景特征点语义

取款机现金存放量的预测方法、装置、设备、介质和产品

时空融合特征静态特征残差网络长短期记忆网络加权特征

基于通话内容的客户意向分析方法、装置及存储介质

编码向量编码特征通话录音系统分析方法音频

基于ASR和NLP技术的采购用智能语音系统

智能语音系统信息提取模型语音识别模型联合损失函数数据存储

一种电力维修场景下的流式语音识别方法及系统

站点导航

APP 下载