苗语三元数据库构建方法、模型训练方法及语音识别方法

AITNT
正文
推荐专利
苗语三元数据库构建方法、模型训练方法及语音识别方法
申请号:CN202411838698
申请日期:2024-12-13
公开号:CN120011473A
公开日期:2025-05-16
类型:发明专利
摘要
本发明涉及一种苗语三元数据库构建方法、模型训练方法及语音识别方法。其中的构建方法包括,根据预设的文本数据规则,获取苗语文本数据,作为苗语三元数据库的文本部分;根据第一映射规则和预设的音频数据规则,获取苗语音频数据,作为苗语三元数据库的音频部分,第一映射规则用于确定苗语文本数据与苗语音频数据的映射关系;根据第二映射规则,获取苗语音素数据,作为苗语三元数据库的音素部分,第二映射规则用于确定苗语文本数据与苗语音素数据的映射关系,至此得到包括文本部分、音频部分和音素部分的完整的苗语三元数据库。与现有技术相比,本发明具有适用性更强、结构更合理、能够得到准确的苗语识别结果等优点。
技术关键词
数据库构建方法 文本 音频 语音识别方法 语音识别模型 模型训练方法 发音 拼音 数据格式 指向性麦克风 构建词典 录制设备 日常生活 基础 录音机 关系
系统为您推荐了相关专利信息
1
一种基于人机交互的多系统能力智能执行方法及系统
人机交互输入 机器学习训练模型 节点 意图识别 定义
2
基于文本提示词的语音合成方法、装置、设备和存储介质
文本内容特征 信息适配器 BERT模型 语音编码器 风格
3
电力调度预处理文本的生成方法及装置
关键词 电力 大语言模型 语句样本集 生成方法
4
基于多特征融合的磁盘故障预警方法、装置、设备及介质
故障预测模型 磁盘故障 多源特征 样本平衡方法 预警方法
5
基于蓝牙音频SoC的智能闹钟控制方法、智能蓝牙耳机和存储介质
智能闹钟控制方法 音乐播放参数 智能蓝牙耳机 闹铃 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号