基于国际音标的发音词典自动构建方法、装置、设备及介质

AITNT
正文
推荐专利
基于国际音标的发音词典自动构建方法、装置、设备及介质
申请号:CN202411112591
申请日期:2024-08-14
公开号:CN119107938A
公开日期:2024-12-10
类型:发明专利
摘要
本发明提供了一种基于国际音标的发音词典自动构建方法、装置、设备及介质,包括:建立以音素为隐变量的语音识别模型;使用联合随机近似方法对语音识别模型进行训练以及优化,实现自动构建发音词典。本发明能够完成输入音频特征序列即可得到其音素和文本的对应,相对于现有的技术,其利用预训练的模型能够在一种新的语言上进行任务,使用预训练的模型,能够方便地迁移到另一种新的语言上进行训练,得到该语言的发音词典,正确率高,同时便于维护,成本较低。
技术关键词
发音词典 自动构建方法 语音识别模型 音频特征 特征矢量序列 语音特征 神经网络参数 变量 词语 解码器 编码器 处理器通信 正确率 电子设备 介质
系统为您推荐了相关专利信息
1
基于向导式的专病库数据模型自动构建方法和系统
自动构建方法 语句 字段 表单 拼音首字母
2
一种基于元信息的多层次图多模态情感分析方法和装置
情感分析方法 多头注意力机制 音频特征 编码器 多模态特征融合
3
音频失真修复方法、音频播放方法及系统
音频失真 修复方法 音频播放方法 信号 音频特征
4
一种基于特征解耦的自适应口音语音识别方法
语音识别模型 语音识别方法 声学特征 多任务 解码器
5
低资源设备上的语音识别训练方法、装置以及设备
语音识别训练方法 训练神经网络 智能语音设备 语音识别模型 词语
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号