混合语音发音序列生成方法和模型训练方法、相关装置

AITNT
正文
推荐专利
混合语音发音序列生成方法和模型训练方法、相关装置
申请号:CN202510036970
申请日期:2025-01-09
公开号:CN120071893B
公开日期:2025-11-07
类型:发明专利
摘要
本申请公开了混合语音发音序列生成方法和模型训练方法、相关装置,该混合语音发音序列生成方法包括:基于原始音频信号进行发音预测,得到原始音频信号的预测发音序列,其中,原始音频信号为第一语种对应的音频信号,且携带有第二语种对应的目标词组,第一语种和第二语种为不同的语言;对预测发音序列进行分析,得到目标词组的实际发音序列;以及,生成包含目标词组的初始文本;利用目标词组的实际发音序列与初始文本,生成初始文本对应的混合语音发音序列。上述方案,能够提升多语种混合音频发音序列的质量。
技术关键词
序列生成方法 模型训练方法 语音 文本识别 音频特征 滤波器 发音特征 信号 样本 模块 处理器 可读存储介质 程序 指令 格式 存储器
系统为您推荐了相关专利信息
1
一种参数生成方法及相关装置
参数生成方法 人脸偏转角度 参数生成装置 情绪识别模型 电子设备
2
一种具有方言语音识别的智能终端系统及装置
智能终端系统 数据储存模块 语音识别单元 语音采集模块 智能终端装置
3
一种针对职业技能评估的语音输入测评方法、装置、计算机设备及可读存储介质
同义词 分词 文本 语音识别模型 关键词
4
用于识别车辆乘员的情绪的方法和设备
识别车辆乘员 神经网络模型 梅尔频率倒谱系数 特征点 线性单元
5
数字人口型与语音对齐方法、装置、电子设备及存储介质
语音对齐方法 文本 数据 大语言模型 口型识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号