基于人工智能的语音处理方法、装置、计算机设备及介质

正文

推荐专利

申请号：CN202411377002

申请日期：2024-09-29

公开号：CN119274529A

公开日期：2025-01-07

类型：发明专利

摘要

本申请属于人工智能技术领域，涉及一种基于人工智能的语音处理方法、装置、计算机设备及存储介质，包括：基于语言转换模型的内容编码器，节奏编码器与音高编码器对待处理语音进行特征提取，得到内容特征、节奏特征与音高特征；基于瓶颈适配器对内容特征、节奏特征与音高特征进行调整，得到指定内容特征、指定节奏特征与指定音高特征；基于一致性模块对指定内容特征进行优化得到目标内容特征；基于目标内容特征、指定节奏特征、指定音高特征及说话人嵌入向量生成目标特征向量；基于扩散模型对目标特征向量进行处理得到目标频谱特征；基于声码器将目标频谱特征转换为合成语音。本申请提高了语音解耦的效率和精度，提升了合成语音的音质。

技术关键词

节奏特征语音频谱特征计算机可读指令排序损失文本编码器计算机设备生成样本数据模块适配器梯度下降算法可读存储介质人工智能技术瓶颈声码器处理器采样率存储器

系统为您推荐了相关专利信息

图像检测方法、装置、计算机设备及存储介质

图像检测方法特征提取模型语义特征提取文本计算机可读指令

一种适用于多场景动态图像的集成分析方法、系统、存储介质及程序产品

集成分析系统物体集成分析方法节奏特征图像采集设备

多模态语言模型的训练方法和使用方法

词典样本文本索引多模态

基于静态频谱特征的气体浓度预测方法

气体浓度预测方法频谱特征训练深度学习模型电阻值气敏电阻

音频功能检测方法、装置及设备

待测产品功能检测方法功能检测装置音频语音识别模块

基于人工智能的语音处理方法、装置、计算机设备及介质

站点导航

APP 下载