混合语音发音序列生成方法和模型训练方法、相关装置

正文

推荐专利

申请号：CN202510036970

申请日期：2025-01-09

公开号：CN120071893B

公开日期：2025-11-07

类型：发明专利

摘要

本申请公开了混合语音发音序列生成方法和模型训练方法、相关装置，该混合语音发音序列生成方法包括：基于原始音频信号进行发音预测，得到原始音频信号的预测发音序列，其中，原始音频信号为第一语种对应的音频信号，且携带有第二语种对应的目标词组，第一语种和第二语种为不同的语言；对预测发音序列进行分析，得到目标词组的实际发音序列；以及，生成包含目标词组的初始文本；利用目标词组的实际发音序列与初始文本，生成初始文本对应的混合语音发音序列。上述方案，能够提升多语种混合音频发音序列的质量。

技术关键词

序列生成方法模型训练方法语音文本识别音频特征滤波器发音特征信号样本模块处理器可读存储介质程序指令格式存储器

系统为您推荐了相关专利信息

一种参数生成方法及相关装置

参数生成方法人脸偏转角度参数生成装置情绪识别模型电子设备

一种具有方言语音识别的智能终端系统及装置

智能终端系统数据储存模块语音识别单元语音采集模块智能终端装置

一种针对职业技能评估的语音输入测评方法、装置、计算机设备及可读存储介质

同义词分词文本语音识别模型关键词

用于识别车辆乘员的情绪的方法和设备

识别车辆乘员神经网络模型梅尔频率倒谱系数特征点线性单元

数字人口型与语音对齐方法、装置、电子设备及存储介质

语音对齐方法文本数据大语言模型口型识别

混合语音发音序列生成方法和模型训练方法、相关装置

站点导航

APP 下载