一种基于伪标签生成和模型迁移的壮语语音识别方法

AITNT
正文
推荐专利
一种基于伪标签生成和模型迁移的壮语语音识别方法
申请号:CN202411053578
申请日期:2024-08-02
公开号:CN118887948A
公开日期:2024-11-01
类型:发明专利
摘要
本发明提供一种基于伪标签生成和模型迁移的壮语语音识别方法,包括两个步骤:第一步,进行声学模型的训练,包括IPA伪标签数据的生成以及声学模型的训练;第二步,语音识别系统的训练,包括声学模型的迁移,以及基于注意力机制的编码器解码器架构的语音识别模型的训练。本发明通过借助伪标签生成的方法,解决了大量无标注壮语音频数据无法充分利用的问题,并以此来训练声学模型。再通过声学模型迁移的方法,解决少量有标注数据难以训练可用壮语语音识别模型的问题。
技术关键词
壮语语音识别方法 语音识别模型 编码器解码器 训练声学模型 音频 注意力机制 语音识别系统 标签 序列 文本 数据 编码器结构 解码方式 语音特征 解码方法 发音
系统为您推荐了相关专利信息
1
一种车载多媒体音频无声检测设备
无声检测设备 信号切换开关 车载多媒体 多媒体主机 单片机
2
一种音频信号处理方法及相关设备
噪声信息 降噪模型 音频信号处理方法 样本 语音
3
一种学前教育用的互动学习系统
互动学习系统 语音输入模块 实体教具 投影显示设备 图像采集模块
4
一种基于AI的智能客服电话报修方法和系统
报修方法 智能客服 图谱 键值 实体
5
一种基于多模态大模型的视觉语言交互方法及系统
语言交互方法 语言交互系统 多模态信息 数据 可视化模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号