摘要
本发明属于语音识别领域,具体涉及一种面向移动端的语音数字识别方法、存储介质、移动终端。本发明采用了CNN+CTC的浅层神经网络结构,模型小,可以直接部署于移动终端,减少对服务器的资源消耗和带宽的依赖,不仅满足用户对实时性的期望,而且在不稳定的网络环境下保持高效运行,为语音数字识别技术的进一步发展和推广开辟了新的可能性;此外,与传统语音识别方法不同,本发明所使用的CNN实现了端到端的训练和预测,保证了声学模型的全局最优性能,为整体声学模型的稳健性提供了有效支持。
技术关键词
语音数字识别方法
频谱特征提取
语音数字识别技术
数字自动识别方法
Adam算法
损失函数优化
文本
移动终端
构建语言模型
浅层神经网络
拼音
短时傅里叶变换
语音识别方法
标签
处理器
数据
错误率
存储器
系统为您推荐了相关专利信息
轨迹预测方法
时间卷积网络
特征点
滑翔飞行器
序列
RBF神经网络
Adam算法
生成方法
遗传算法
生成测试用例
关键点
遥感图像配准方法
图片
更新网络参数
训练集
媒体资产管理
智能镜头
前端模块
语义场景
特征数据库
图像质控方法
血管壁
磁共振
动脉粥样硬化病变
运动伪影