一种实时情感模拟的声音克隆系统

正文

推荐专利

一种实时情感模拟的声音克隆系统

申请号：CN202411636143

申请日期：2024-11-15

公开号：CN119400190A

公开日期：2025-02-07

类型：发明专利

摘要

本发明涉及语音技术领域，公开了一种实时情感模拟的声音克隆系统，包括：所述语音特征提取模块用于从预处理后的语音数据中提取关键的音高、音调、频谱特征，为情感建模提供基础，语音特征提取模块与情感建模模块连接，提取的特征作为情感建模的输入；所述语音合成模块用于根据情感建模模块生成的特征；所述质量评估与优化模块用于对生成的语音进行质量评估，并根据评估结果和用户反馈来优化系统。通过生成对抗网络和循环神经网络模型，生成高度逼真的语音，语音输出在音质和自然度上接近真人语音，避免了传统语音合成技术中常见的机械化和单调问题，这一优势特别适用于需要真实语音体验的场景，如虚拟助手、在线教育和客户服务。

技术关键词

克隆系统语音特征提取生成对抗网络数据缓存单元特征提取算法存储单元循环神经网络模型生成语音频谱特征展示单元采集单元生成高度界面指标特征提取模块语音技术

系统为您推荐了相关专利信息

一种基于大模型实现多语言智能语音质检系统

质检系统智能语音情感表达方式多语言语音识别模块

无人机轻量化语义视觉惯性里程计方法、介质及处理设备

视觉惯性里程计方法静态特征相机模块特征点信息无人机

基于工业互联网的设备故障预测方法、装置及存储介质

异常信号设备故障预测方法生成控制指令设备端采集设备

基于深度学习的无人机信号智能探测与反制方法

反制方法生成对抗网络模型策略信号特征干扰设备

可自适应扩展的实时无人机飞行异常状态识别方法及系统

基线异常状态实时数据识别方法无人机实时飞行

一种实时情感模拟的声音克隆系统

站点导航

APP 下载