语音处理模型的训练方法、语音处理方法、装置及设备

AITNT
正文
推荐专利
语音处理模型的训练方法、语音处理方法、装置及设备
申请号:CN202411892310
申请日期:2024-12-20
公开号:CN119763548A
公开日期:2025-04-04
类型:发明专利
摘要
本公开提供了一种语音处理模型的训练方法、语音处理方法、装置及设备,属于计算机技术领域。方法包括:对样本语音信号进行语音编码,得到所述样本语音信号的语义嵌入表示和声学嵌入表示;对所述样本语音信号的参考语音文本进行音素提取和音素编码,得到所述参考语音文本的音素嵌入表示;基于所述语义嵌入表示、所述声学嵌入表示以及所述音素嵌入表示,训练语音处理模型,所述语音处理模型用于对输入的语音进行实时语音合成。该方法通过在模型训练过程中引入了语义信息和声学信息,使得模型能够学习到更干净的语义信息,在对语音进行处理时,可以保留更多的语言信息,提高了合成语音的自然度。
技术关键词
语音编码 语音特征 语义 样本 文本 信号 实时语音 解码单元 电子设备 可执行程序代码 处理器 可读存储介质 计算机程序产品 序列 训练装置 存储器
系统为您推荐了相关专利信息
1
演示文稿自动更新方法、系统、设备及存储介质
自动更新方法 文本段落 矩阵 演示文稿内容 语义
2
一种元件装配异常检测方法
检测元件 字符识别模型 异常检测方法 图像 计算机视觉技术
3
用于规定性消息传递的方法和系统
状态监测系统 资产 消息 警报 数据处理系统
4
一种电机运行故障预测方法及系统
电机运行故障 故障预测模型 长短期记忆网络 时间序列特征 频域特征
5
多功能仿生机器人智能任务规划和控制方法及系统
仿生机器人 注意力 事件流 节点 控制器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号