一种语音转换方法、装置、设备及存储介质

正文

推荐专利

一种语音转换方法、装置、设备及存储介质

申请号：CN202510726669

申请日期：2025-05-30

公开号：CN120636423A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及语音语义技术领域，可应用于医疗健康和金融科技等领域，公开了一种语音转换方法、装置、设备及存储介质，包括：获取输入语音信号，并将输入语音信号转换为梅尔频谱图；通过音色编码器、内容编码器和韵律编码器从梅尔频谱图中分别提取基本内容信息、全局音色信息和韵律特征信息；对全局音色信息、基本内容信息和韵律特征信息进行量化处理，分别生成音色量化信息、内容量化信息和韵律量化信息；将音色量化信息、内容量化信息和韵律量化信息输入至神经网络模型内，得到语音特征信息；将语音特征信息输入解码器，得到目标语音信号。本发明将语音信号解耦为音色、内容和韵律三个独立属性，分别通过专用编码器提取特征，提高了编码效率。

技术关键词

语音转换方法韵律特征语音特征信息解码信息神经网络模型输入解码器矢量量化语音语义技术池化特征加权特征语音转换装置专用编码器多尺度通道注意力机制全局平均池化信号处理器可读存储介质

系统为您推荐了相关专利信息

一种自适应调节切割深度的钢筋混凝土排水管道切割机构

水切割刀头切割头设备线性驱动设备钢筋混凝土排水管道高频超声

基于BIM与大数据分析的施工现场安全风险智能预警系统及方法

智能预警系统风险预测模型施工现场卷积神经网络模型迁移学习技术

基于人工智能的多渠道广告效果预测与优化方法及系统

广告管理平台广告特征广告投放策略梯度算法跨渠道

风险评估方法、装置及电子设备

识别关键字风险评估方法文本机器学习算法语义

一种基于预测驱动的船舶异常行为预警方法和系统

船舶预警方法残差信息风险数据

一种语音转换方法、装置、设备及存储介质

站点导航

APP 下载