一种语音识别方法、装置、电子设备及介质

AITNT
正文
推荐专利
一种语音识别方法、装置、电子设备及介质
申请号:CN202411845648
申请日期:2024-12-13
公开号:CN119811394A
公开日期:2025-04-11
类型:发明专利
摘要
本申请提供了一种语音识别方法、装置、电子设备及介质,所述方法包括:响应于用户的语音识别请求,获取待识别音频,对待识别音频进行采样得到初始音频数据,确定初始音频数据的频谱特征数据,根据频谱特征数据对初始音频数据进行处理,得到人声音频数据,拆分人声音频数据得到目标音频数据,将目标音频数据输入预先训练的语音识别模型进行并行识别,得到语音识别模型输出的初始文本序列,根据人声音频数据确定初始文本序列中的单词对应的起止时间,按照起止时间对初始文本序列中的单词进行排序,得到目标文本序列,将目标文本序列作为语音识别结果,并将语音识别结果展示给用户。本申请能够在保证识别速度的同时提高识别准确率,提升用户体验。
技术关键词
语音识别模型 音频 频谱特征 语音识别方法 序列 训练文本数据 注意力 矩阵 上存储计算机程序 滤波器 频率响应 功率 语音识别装置 电子设备 密度 采样率 线性
系统为您推荐了相关专利信息
1
基于二次分解和TCN-ECA-BiGRU的超短期风电功率预测方法
序列 超短期风电功率 短期风电功率预测 集合经验模态分解 样本
2
基于神经网络模型的放疗图像信息的融合方法和融合系统
神经网络模型 特征值 融合方法 轮廓区域 稳定特征点
3
软件功能迭代方法及装置
频繁项集挖掘算法 多模型 迭代方法 时间序列模型 生成对抗网络
4
能耗不合理区域的确定方法及装置、存储介质及电子装置
预测能耗数据 能耗预测模型 能耗特征 因子 电子装置
5
一种稀土金属电解炉的反应状态识别方法与监控系统
稀土金属电解炉 状态识别方法 局部时空特征 时序依赖关系 视频帧
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号