摘要
本发明涉及基于语音大模型的老挝语‑英语混合语言语音合成方法,属于自然语言处理技术领域。老挝由于其独特的经济背景、地理位置以及历史因素,使其语言面临着文本中存在许多英语词汇,针对在单语语音数据的情况下,老挝语中的英语词汇难以准确发音的问题,本发明提出了一种基于语音大模型的老挝语‑英语混合语言语音合成方法,主要包括融合不同语言的统一潜在空间的混合语言语音大模型构建、融入老挝语语言ID、老挝语‑英语混合语言语音合成三部分。本发明使合成的混合语言语音不仅能在语音质量上达到较高的自然度,还能够有效应对不同语言的发音差异,使得在语言切换时的合成语音听起来更加流畅。
技术关键词
英语
注意力机制
神经机器翻译系统
非暂态计算机可读存储介质
声学特征
语音编码器
文本
音频
处理器
计算机程序产品
语音特征
发音
自然语言
标记
多用户
存储器
矩阵
系统为您推荐了相关专利信息
身份认证方法
注意力机制
鼠标
前馈神经网络
编码器
人脸门禁识别方法
人脸特征
人脸识别模型
人脸门禁识别系统
图像处理
预优化方法
多尺度注意力机制
计划
逻辑
数据库查询优化
编码器
Sinc函数
音频特征提取
更新网络参数
小波散射网络