语音合成方法及装置

AITNT
正文
推荐专利
语音合成方法及装置
申请号:CN202510555012
申请日期:2025-04-29
公开号:CN120431902A
公开日期:2025-08-05
类型:发明专利
摘要
本申请公开了一种语音合成方法,属于语音处理技术领域。该方法包括:获取音频数据和文本数据并进行预处理,得到token字典;将token字典输入到文本‑语音模型中,得到文本‑语音令牌集;将文本‑语音令牌集输入到因果流匹配模型中,得到梅尔频谱图;将梅尔频谱图输入到声码器模型中,输出目标语音。该方法提升了语音合成的速度和质量。
技术关键词
语音 令牌 语义特征 字典 音频 数据 非暂态计算机可读存储介质 文本编码器 韵律特征 处理器 融合算法 注意力机制 输出模块 序列 波形 上采样 存储器 电子设备
系统为您推荐了相关专利信息
1
一种供应链优化方法、系统、智能终端及存储介质
供应链优化方法 管理策略 自然语言 物料运输效率 矩阵
2
一种光纤网络线路巡检装置
线路巡检装置 光纤网络 接线端口 信号发射器 调频模块
3
基于转换器模型进行视听模态融合的具身视听导航方法
音频编码器 深度编码器 视听 导航方法 转换器
4
一种应用于文本转语音的大规模语音克隆模型智能管理方法
语音 智能管理方法 负载均衡器 文本 智能管理系统
5
图像生成方法、设备、存储介质及程序产品
图像生成模型 多模态 多媒体 预训练语言模型 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号