基于语音大模型的老挝语-英语混合语言语音合成方法

AITNT
正文
推荐专利
基于语音大模型的老挝语-英语混合语言语音合成方法
申请号:CN202510786476
申请日期:2025-06-12
公开号:CN120708594A
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及基于语音大模型的老挝语‑英语混合语言语音合成方法,属于自然语言处理技术领域。老挝由于其独特的经济背景、地理位置以及历史因素,使其语言面临着文本中存在许多英语词汇,针对在单语语音数据的情况下,老挝语中的英语词汇难以准确发音的问题,本发明提出了一种基于语音大模型的老挝语‑英语混合语言语音合成方法,主要包括融合不同语言的统一潜在空间的混合语言语音大模型构建、融入老挝语语言ID、老挝语‑英语混合语言语音合成三部分。本发明使合成的混合语言语音不仅能在语音质量上达到较高的自然度,还能够有效应对不同语言的发音差异,使得在语言切换时的合成语音听起来更加流畅。
技术关键词
英语 注意力机制 神经机器翻译系统 非暂态计算机可读存储介质 声学特征 语音编码器 文本 音频 处理器 计算机程序产品 语音特征 发音 自然语言 标记 多用户 存储器 矩阵
系统为您推荐了相关专利信息
1
一种基于大语言模型的多信息元素语义组合方法和系统
大语言模型 组合方法 字符 高维向量空间 文本
2
一种基于时间序列残差编码器的鼠标动力学身份认证方法
身份认证方法 注意力机制 鼠标 前馈神经网络 编码器
3
基于图像处理的人脸门禁识别系统、方法及存储介质
人脸门禁识别方法 人脸特征 人脸识别模型 人脸门禁识别系统 图像处理
4
数据库查询预优化方法、系统、设备及介质
预优化方法 多尺度注意力机制 计划 逻辑 数据库查询优化
5
一种基于小波散射变换的鸟鸣声分类的方法
编码器 Sinc函数 音频特征提取 更新网络参数 小波散射网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号