基于语音令牌融合的语音合成方法、装置、设备及介质

AITNT
正文
推荐专利
基于语音令牌融合的语音合成方法、装置、设备及介质
申请号:CN202511218871
申请日期:2025-08-28
公开号:CN121034278A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及语音语义技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种基于语音令牌融合的语音合成方法、装置、设备及介质,所述方法包括:获取初始文本,将所述初始文本转换为初始潜在表示,并对所述初始潜在表示进行文本编码,得到目标文本特征;根据所述目标文本特征生成所述初始文本对应的语义令牌,并对所述语义令牌与所述目标文本特征进行时序对齐,得到目标语义令牌;获取参考用户的用户语音,提取所述用户语音的音色特征,根据所述音色特征和所述目标语义令牌逐帧生成梅尔频谱图;根据所述梅尔频谱图进行语音合成,得到目标语音。本发明可以提高语音合成效率和质量。
技术关键词
令牌 音色特征 文本 时序 频谱特征 参数 语音语义技术 序列 波形 时域特征 融合特征 层级 处理器 置信度阈值 编码 错位 医疗健康 变换算法
系统为您推荐了相关专利信息
1
基于AI预测的卫星信道干扰抑制与4K信号增强系统及方法
信道干扰抑制 策略 分析单元 接收端 发射端
2
基于大数据与人工智能的农户创业融资风险评估系统
融资风险评估 融资数据 参数 样本 聚类
3
一种基于语义一致性的开放词汇视听分割方法
音频特征 视觉特征 语义 跨模态 视听
4
基于检索增强生成的多模态事实核查方法
多模态 语义特征 文本 融合特征 多任务学习模型
5
用于应届生简历筛选的大语言模型训练方法及其应用方法
语言模型训练方法 大语言模型 计算机程序指令 数据 简历筛选方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号