语音合成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202511233412

申请日期：2025-08-29

公开号：CN120808754A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于医疗健康及金融技术领域，公开了语音合成方法、装置、计算机设备及存储介质。所述方法包括：获取待处理文本、插值后的噪音、未掩码的语音；将所述待处理文本、插值后的噪音、未掩码的语音输入至合成模型，由所述合成模型通过对待处理文本进行编码，并结合调整后的噪音以及未掩码的语音，学习时间维度上的特征变化，并将将噪音转换为目标语音特征，形成预测结果；输出所述预测结果。通过实施本发明实施例的方法可实现显著提升零样本TTS系统的运行效率和降低部署成本，还在保持音色一致性和内容保真度的同时，增强对齐的稳定性和语音的自然流畅度。

技术关键词

文本编码器语音特征解码器计算机设备 TTS系统人工智能技术医疗健康语义卷积模块处理器学生存储器注意力教师金融指数机制

系统为您推荐了相关专利信息

一种机理驱动的多工作模态混合励磁电机优化方法

混合励磁电机非线性励磁绕组励磁指标磁路磁阻

基于物理机制和勘测监测数据的堰塞坝工后重构方法

有限元算法坝体曲线防渗结构应力

水电站发电机组的温度监测报警系统及方法

水电站发电机组时序功率矩阵注意力

一种光学邻近校正方法及光刻掩膜生成模型

光刻掩膜光学邻近校正方法卷积模块编码器版图

基于注意力增强的端到端语音识别方法、程序产品和设备

语音识别方法注意力语音识别网络解码器声学特征

语音合成方法、装置、计算机设备及存储介质

站点导航

APP 下载