一种电力维修场景下的流式语音识别方法及系统

AITNT
正文
推荐专利
一种电力维修场景下的流式语音识别方法及系统
申请号:CN202411090688
申请日期:2024-08-09
公开号:CN118782023A
公开日期:2024-10-15
类型:发明专利
摘要
本发明公开了一种电力维修场景下的流式语音识别方法及系统,属于语音识别技术领域,包括收集包含电力系统维护场景的语音数据;对所述语音数据进行预处理并标注,得到标注的语音数据;对标注后的语音数据进行分段处理,提取每段语音数据的动态特征和静态特征,将所述动态特征和静态特征拼接后作为每段语音数据的特征向量;将每段语音数据的特征向量输入至流式语音识别模型进行训练,得到训练好的电力场景下的流式语音识别模型;获取当前语音数据,对当前语音数据进行识别。通过构建并训练流式语音识别模型提高语音识别的实时性,并且还通过结合静态特征和动态特征可以捕捉更多语音信号的细节和变化,提高语音识别模型的准确性和鲁棒性。
技术关键词
流式语音识别方法 语音识别模型 静态特征 梅尔频率倒谱系数 电力系统维护 场景 动态 估计噪声功率 短时傅里叶变换 语音识别系统 分段 语音识别技术 离散余弦变换 模型训练模块 特征提取模块 数据获取模块 数据处理模块
系统为您推荐了相关专利信息
1
基于多尺度CNN和Transformer融合的语音情感识别方法
语音情感识别方法 MFCC特征 情感类别 Softmax函数 前馈神经网络
2
一种基于深度一致性约束的语义动态SLAM处理方法
静态特征 关键帧 场景 特征点 语义
3
取款机现金存放量的预测方法、装置、设备、介质和产品
时空融合特征 静态特征 残差网络 长短期记忆网络 加权特征
4
基于通话内容的客户意向分析方法、装置及存储介质
编码向量 编码特征 通话录音系统 分析方法 音频
5
基于ASR和NLP技术的采购用智能语音系统
智能语音系统 信息提取模型 语音识别模型 联合损失函数 数据存储
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号