一种目标语音生成方法及系统

正文

推荐专利

一种目标语音生成方法及系统

申请号：CN202411586070

申请日期：2024-11-08

公开号：CN119152833A

公开日期：2024-12-17

类型：发明专利

摘要

本发明公开了一种目标语音生成方法及系统，方法包括以下步骤：获取第一语音、第二语音以及目标文本；根据第一语音提取信息特征；根据第二语音提取风格特征；根据目标文本提取音素对应特征；根据信息特征、风格特征以及音素对应特征生成目标语音。本发明以第一语音的信息特征为基础，进一步整合了第二语音的风格特征；即便在面临训练样本有限的情况下，本发明也能灵活生成任意说话人在多样化场景中的音频，不仅极大地丰富了音频表达的维度与深度；并且这种跨语音特征的融合显著提升了目标语音的表达力和说服力，使其更加贴近真实人类交流的情感浓度，能够大大增加目标语音的自然度，从而引起听众的共鸣。

技术关键词

语音生成方法语义特征大语言模型文本特征提取模块风格令牌音频转换算法语音特征生成系统单人数据模式人类场景基础

系统为您推荐了相关专利信息

一种无人机异常分析方法及系统

异常分析方法故障诊断模型机器学习模型长短期记忆网络寿命预测模型

冲击波治疗仪的控制方法、装置、电子设备及存储介质

冲击波治疗仪大语言模型意图识别机器可读指令数据格式

一种身份核验方法、装置及设备

答案验证规则人机交互数据大语言模型身份核验方法

基于双模型架构的机器人任务数据处理方法及机器人

主控单元多模态动作列表指令机器人控制系统

一种汽车造型设计方法、系统、电子设备及存储介质

汽车造型设计深度神经网络眼动追踪技术指标混合分析方法

一种目标语音生成方法及系统

站点导航

APP 下载