苗语三元数据库构建方法、模型训练方法及语音识别方法

正文

推荐专利

申请号：CN202411838698

申请日期：2024-12-13

公开号：CN120011473A

公开日期：2025-05-16

类型：发明专利

摘要

本发明涉及一种苗语三元数据库构建方法、模型训练方法及语音识别方法。其中的构建方法包括，根据预设的文本数据规则，获取苗语文本数据，作为苗语三元数据库的文本部分；根据第一映射规则和预设的音频数据规则，获取苗语音频数据，作为苗语三元数据库的音频部分，第一映射规则用于确定苗语文本数据与苗语音频数据的映射关系；根据第二映射规则，获取苗语音素数据，作为苗语三元数据库的音素部分，第二映射规则用于确定苗语文本数据与苗语音素数据的映射关系，至此得到包括文本部分、音频部分和音素部分的完整的苗语三元数据库。与现有技术相比，本发明具有适用性更强、结构更合理、能够得到准确的苗语识别结果等优点。

技术关键词

数据库构建方法文本音频语音识别方法语音识别模型模型训练方法发音拼音数据格式指向性麦克风构建词典录制设备日常生活基础录音机关系

系统为您推荐了相关专利信息

一种基于人机交互的多系统能力智能执行方法及系统

人机交互输入机器学习训练模型节点意图识别定义

基于文本提示词的语音合成方法、装置、设备和存储介质

文本内容特征信息适配器 BERT模型语音编码器风格

电力调度预处理文本的生成方法及装置

关键词电力大语言模型语句样本集生成方法

基于多特征融合的磁盘故障预警方法、装置、设备及介质

故障预测模型磁盘故障多源特征样本平衡方法预警方法

基于蓝牙音频SoC的智能闹钟控制方法、智能蓝牙耳机和存储介质

智能闹钟控制方法音乐播放参数智能蓝牙耳机闹铃音频

苗语三元数据库构建方法、模型训练方法及语音识别方法

站点导航

APP 下载