摘要
本发明公开了一种方言语音的文字转换方法、装置及介质。其中,方法包括:收集不同地区的方言语音数据,其中方言语音数据包括方言的发音、语速以及语调;采用Mel频率倒谱系数算法、长时平均短时能量比算法以及语音端点检测算法对方言语音数据进行语音特征提取,获取方言语音数据的多种特征音频数据;根据多种特征音频数据以及方言语音数据的文本标注对机器学习模型进行训练,生成方言语音转换模型;将待转换方言语音数据的多种待转换特征音频数据输入至方言语音转换模型,输出待转换方言语音数据的方言转换文本。
技术关键词
语音端点检测算法
语音特征提取
文字转换方法
数据
机器学习模型
音频
转换文本
频率
滤波器
子模块
发音
电子设备
处理器
可读存储介质
指令
存储器