语音合成方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
语音合成方法、装置、计算机设备及存储介质
申请号:CN202511233412
申请日期:2025-08-29
公开号:CN120808754A
公开日期:2025-10-17
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于医疗健康及金融技术领域,公开了语音合成方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文本、插值后的噪音、未掩码的语音;将所述待处理文本、插值后的噪音、未掩码的语音输入至合成模型,由所述合成模型通过对待处理文本进行编码,并结合调整后的噪音以及未掩码的语音,学习时间维度上的特征变化,并将将噪音转换为目标语音特征,形成预测结果;输出所述预测结果。通过实施本发明实施例的方法可实现显著提升零样本TTS系统的运行效率和降低部署成本,还在保持音色一致性和内容保真度的同时,增强对齐的稳定性和语音的自然流畅度。
技术关键词
文本编码器 语音特征 解码器 计算机设备 TTS系统 人工智能技术 医疗健康 语义 卷积模块 处理器 学生 存储器 注意力 教师 金融 指数 机制
系统为您推荐了相关专利信息
1
一种机理驱动的多工作模态混合励磁电机优化方法
混合励磁电机 非线性 励磁绕组励磁 指标 磁路磁阻
2
基于物理机制和勘测监测数据的堰塞坝工后重构方法
有限元算法 坝体 曲线 防渗结构 应力
3
水电站发电机组的温度监测报警系统及方法
水电站发电机组 时序 功率 矩阵 注意力
4
一种光学邻近校正方法及光刻掩膜生成模型
光刻掩膜 光学邻近校正方法 卷积模块 编码器 版图
5
基于注意力增强的端到端语音识别方法、程序产品和设备
语音识别方法 注意力 语音识别网络 解码器 声学特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号