语音表征模型训练方法、装置及相关设备

AITNT
正文
推荐专利
语音表征模型训练方法、装置及相关设备
申请号:CN202410764455
申请日期:2024-06-13
公开号:CN118824233A
公开日期:2024-10-22
类型:发明专利
摘要
本公开关于语音表征模型训练方法、装置及相关设备,该方法包括获取样本文本、对应的样本梅尔谱及对应的样本音素序列;通过初始模型的音素编码器对样本音素序列进行编码得到样本音素特征;通过初始模型的语音编码器对样本梅尔谱进行编码得到样本语音特征;对样本语音特征进行量化得到样本语音量化特征;对样本梅尔谱进行截取得到提示梅尔谱;通过初始模型的提示编码器对提示梅尔谱进行编码得到样本提示特征;通过初始模型的语音解码器,基于样本提示特征对样本语音量化特征进行解码得到预测梅尔谱;通过初始模型的音素解码器,对样本语音量化特征进行解码得到预测音素序列;基于模型损失训练初始模型得到语音表征模型。本公开可提升语音表征质量。
技术关键词
样本 语音特征 编码向量 序列 语音解码器 语音编码器 模型训练方法 文本 计算机程序产品 可读存储介质 模型训练装置 电子设备 处理器 特征提取模块
系统为您推荐了相关专利信息
1
一种基于懒更新策略的R+树动态发布订阅方法
发布订阅方法 列表 字段 关系 标识
2
一种基于权重叠加的大语言模型指纹添加方法和设备
指纹 基础 大语言模型 数据 存储计算机程序
3
一种融合大语言模型与知识图谱的中医证候预测方法
大语言模型 患者 神经网络模型 训练样本集 知识图谱查询
4
基于人力资源大数据的多维度人才推荐方法
人才推荐方法 人才画像 样本 大数据 生成企业
5
一种临床生物样本中痕量药物代谢产物的富集检测方法
富集检测方法 遗传算法融合 痕量药物 背景噪声抑制 多模态数据融合
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号