摘要
本发明涉及一种苗语三元数据库构建方法、模型训练方法及语音识别方法。其中的构建方法包括,根据预设的文本数据规则,获取苗语文本数据,作为苗语三元数据库的文本部分;根据第一映射规则和预设的音频数据规则,获取苗语音频数据,作为苗语三元数据库的音频部分,第一映射规则用于确定苗语文本数据与苗语音频数据的映射关系;根据第二映射规则,获取苗语音素数据,作为苗语三元数据库的音素部分,第二映射规则用于确定苗语文本数据与苗语音素数据的映射关系,至此得到包括文本部分、音频部分和音素部分的完整的苗语三元数据库。与现有技术相比,本发明具有适用性更强、结构更合理、能够得到准确的苗语识别结果等优点。
技术关键词
数据库构建方法
文本
音频
语音识别方法
语音识别模型
模型训练方法
发音
拼音
数据格式
指向性麦克风
构建词典
录制设备
日常生活
基础
录音机
关系
系统为您推荐了相关专利信息
人机交互输入
机器学习训练模型
节点
意图识别
定义
文本内容特征
信息适配器
BERT模型
语音编码器
风格
故障预测模型
磁盘故障
多源特征
样本平衡方法
预警方法
智能闹钟控制方法
音乐播放参数
智能蓝牙耳机
闹铃
音频