基于国际音标的发音词典自动构建方法、装置、设备及介质

正文

推荐专利

申请号：CN202411112591

申请日期：2024-08-14

公开号：CN119107938A

公开日期：2024-12-10

类型：发明专利

摘要

本发明提供了一种基于国际音标的发音词典自动构建方法、装置、设备及介质，包括：建立以音素为隐变量的语音识别模型；使用联合随机近似方法对语音识别模型进行训练以及优化，实现自动构建发音词典。本发明能够完成输入音频特征序列即可得到其音素和文本的对应，相对于现有的技术，其利用预训练的模型能够在一种新的语言上进行任务，使用预训练的模型，能够方便地迁移到另一种新的语言上进行训练，得到该语言的发音词典，正确率高，同时便于维护，成本较低。

技术关键词

发音词典自动构建方法语音识别模型音频特征特征矢量序列语音特征神经网络参数变量词语解码器编码器处理器通信正确率电子设备介质

系统为您推荐了相关专利信息

基于向导式的专病库数据模型自动构建方法和系统

自动构建方法语句字段表单拼音首字母

一种基于元信息的多层次图多模态情感分析方法和装置

情感分析方法多头注意力机制音频特征编码器多模态特征融合

音频失真修复方法、音频播放方法及系统

音频失真修复方法音频播放方法信号音频特征

一种基于特征解耦的自适应口音语音识别方法

语音识别模型语音识别方法声学特征多任务解码器

低资源设备上的语音识别训练方法、装置以及设备

语音识别训练方法训练神经网络智能语音设备语音识别模型词语

基于国际音标的发音词典自动构建方法、装置、设备及介质

站点导航

APP 下载