多说话人语音合成方法、装置、存储介质及计算机设备

正文

推荐专利

申请号：CN202511032760

申请日期：2025-07-25

公开号：CN120726991A

公开日期：2025-09-30

类型：发明专利

摘要

本申请涉及多说话人语音合成技术领域，具体提供了一种多说话人语音合成方法、装置、存储介质及计算机设。本申请在开源推理框架vLLM的基础上进行定制化的结构扩展、引擎改造和优化，使得改造得到的目标vLLM框架能够面向语音合成场景，支持语音合成模型的高效推理。通过利用目标vLLM框架和基于LLM的目标语音合成模型实现语音合成推理，从而可在保持语音质量的情况下加速语音合成。

技术关键词

语音文本计算机可读指令框架序列模块索引计算机设备韵律特征机制处理器支路存储器场景标识算法基础

系统为您推荐了相关专利信息

一种自动驾驶拟人连续交互测试场景生成方法

测试场景生成方法交通车轨迹线性回归模型基础

一种具备浓度预测控制能力的智能同位素标记系统

同位素标记数据采集子系统同位素气体轨迹速率

可行驶区域的检测方法、系统、设备及可读存储介质

融合特征非结构化道路多任务模态特征文本

基于线路磁场变量特征的配网线路设施缺陷的检测方法

线路注意力设施状态保存机制磁场传感单元

一种融入图像描述驱动的图文双向检索方法及系统

检索图像双向检索方法图文大语言模型策略

多说话人语音合成方法、装置、存储介质及计算机设备

站点导航

APP 下载