语音表征模型训练方法、装置及相关设备

正文

推荐专利

语音表征模型训练方法、装置及相关设备

申请号：CN202410764455

申请日期：2024-06-13

公开号：CN118824233A

公开日期：2024-10-22

类型：发明专利

摘要

本公开关于语音表征模型训练方法、装置及相关设备，该方法包括获取样本文本、对应的样本梅尔谱及对应的样本音素序列；通过初始模型的音素编码器对样本音素序列进行编码得到样本音素特征；通过初始模型的语音编码器对样本梅尔谱进行编码得到样本语音特征；对样本语音特征进行量化得到样本语音量化特征；对样本梅尔谱进行截取得到提示梅尔谱；通过初始模型的提示编码器对提示梅尔谱进行编码得到样本提示特征；通过初始模型的语音解码器，基于样本提示特征对样本语音量化特征进行解码得到预测梅尔谱；通过初始模型的音素解码器，对样本语音量化特征进行解码得到预测音素序列；基于模型损失训练初始模型得到语音表征模型。本公开可提升语音表征质量。

技术关键词

样本语音特征编码向量序列语音解码器语音编码器模型训练方法文本计算机程序产品可读存储介质模型训练装置电子设备处理器特征提取模块

系统为您推荐了相关专利信息

一种基于懒更新策略的R+树动态发布订阅方法

发布订阅方法列表字段关系标识

一种基于权重叠加的大语言模型指纹添加方法和设备

指纹基础大语言模型数据存储计算机程序

一种融合大语言模型与知识图谱的中医证候预测方法

大语言模型患者神经网络模型训练样本集知识图谱查询

基于人力资源大数据的多维度人才推荐方法

人才推荐方法人才画像样本大数据生成企业

一种临床生物样本中痕量药物代谢产物的富集检测方法

富集检测方法遗传算法融合痕量药物背景噪声抑制多模态数据融合

语音表征模型训练方法、装置及相关设备

站点导航

APP 下载