一种基于伪标签生成和模型迁移的壮语语音识别方法

正文

推荐专利

申请号：CN202411053578

申请日期：2024-08-02

公开号：CN118887948A

公开日期：2024-11-01

类型：发明专利

摘要

本发明提供一种基于伪标签生成和模型迁移的壮语语音识别方法，包括两个步骤：第一步，进行声学模型的训练，包括IPA伪标签数据的生成以及声学模型的训练；第二步，语音识别系统的训练，包括声学模型的迁移，以及基于注意力机制的编码器解码器架构的语音识别模型的训练。本发明通过借助伪标签生成的方法，解决了大量无标注壮语音频数据无法充分利用的问题，并以此来训练声学模型。再通过声学模型迁移的方法，解决少量有标注数据难以训练可用壮语语音识别模型的问题。

技术关键词

壮语语音识别方法语音识别模型编码器解码器训练声学模型音频注意力机制语音识别系统标签序列文本数据编码器结构解码方式语音特征解码方法发音

系统为您推荐了相关专利信息

一种车载多媒体音频无声检测设备

无声检测设备信号切换开关车载多媒体多媒体主机单片机

一种音频信号处理方法及相关设备

噪声信息降噪模型音频信号处理方法样本语音

一种学前教育用的互动学习系统

互动学习系统语音输入模块实体教具投影显示设备图像采集模块

一种基于AI的智能客服电话报修方法和系统

报修方法智能客服图谱键值实体

一种基于多模态大模型的视觉语言交互方法及系统

语言交互方法语言交互系统多模态信息数据可视化模块

一种基于伪标签生成和模型迁移的壮语语音识别方法

站点导航

APP 下载