情感表达的语音克隆方法、装置、设备和介质

正文

推荐专利

申请号：CN202511280700

申请日期：2025-09-09

公开号：CN120783724B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种情感表达的语音克隆方法、装置、设备和介质。所述语音克隆方法包括：获取可以捕捉到更多用户情感信息的用户语音信号，对用户语音信号进行包含噪声去除的预处理，提取预处理后的语音信号的声纹特征，并基于声纹特征和声纹克隆模型进行声纹克隆，以及根据用户语音信号对用户语音信号的情感类型进行分析，并根据分析结果对克隆声纹进行调整，得到更能表达用户情感的目标声纹；最后将目标声纹转换成目标语音信号，并以大于80dB的音量输出。因此，所述语音克隆方法可以较准确捕捉和重现用户声音的情感语调，实现用户复杂的情感表达，使得克隆语音更具自然和生动性，可适应于需要细腻情感表达的场景。

技术关键词

特征提取模型语音克隆方法声纹特征指向性麦克风信号深度神经网络模型支持向量机算法线性预测编码径向基核函数频率采样率特征提取模块特征值存储器噪声处理器输出模块分析模块

系统为您推荐了相关专利信息

语音识别文本的后处理方法、装置、电子设备及存储介质

语音识别文本校正滑动窗口分词字词

施工升降机可移动式安全通道

矩形箱体施工升降机控制器施工升降机轿厢人脸识别设备集装箱改造

基于目标检测、场景识别与人脸匹配的智能导航辅助方法

导航辅助方法头戴式摄像设备场景实时视频流神经网络推理

一种支持多模态输入的低代码平台应用智能生成系统

智能生成系统多模态输入模块对话状态跟踪器子模块

一种超充车辆识别方法及充电桩

车辆阻拦装置车辆识别方法语音播报系统图像识别处理器新能源车

情感表达的语音克隆方法、装置、设备和介质

站点导航

APP 下载