多说话人语音合成方法、装置、存储介质及计算机设备

AITNT
正文
推荐专利
多说话人语音合成方法、装置、存储介质及计算机设备
申请号:CN202511032760
申请日期:2025-07-25
公开号:CN120726991A
公开日期:2025-09-30
类型:发明专利
摘要
本申请涉及多说话人语音合成技术领域,具体提供了一种多说话人语音合成方法、装置、存储介质及计算机设。本申请在开源推理框架vLLM的基础上进行定制化的结构扩展、引擎改造和优化,使得改造得到的目标vLLM框架能够面向语音合成场景,支持语音合成模型的高效推理。通过利用目标vLLM框架和基于LLM的目标语音合成模型实现语音合成推理,从而可在保持语音质量的情况下加速语音合成。
技术关键词
语音 文本 计算机可读指令 框架 序列 模块 索引 计算机设备 韵律特征 机制 处理器 支路 存储器 场景 标识 算法 基础
系统为您推荐了相关专利信息
1
一种自动驾驶拟人连续交互测试场景生成方法
测试场景生成方法 交通车 轨迹 线性回归模型 基础
2
一种具备浓度预测控制能力的智能同位素标记系统
同位素标记 数据采集子系统 同位素气体 轨迹 速率
3
可行驶区域的检测方法、系统、设备及可读存储介质
融合特征 非结构化道路 多任务 模态特征 文本
4
基于线路磁场变量特征的配网线路设施缺陷的检测方法
线路 注意力 设施 状态保存机制 磁场传感单元
5
一种融入图像描述驱动的图文双向检索方法及系统
检索图像 双向检索方法 图文 大语言模型 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号