摘要
本申请提供了一种本申请实施例提供的一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置,所述离散音频特征生成方法基于音频数据分词器实现,所述向量量化模块中包括多个码本,每个码本包括多个码本向量;所述生成方法包括:将初始音频数据输入所述编码器,得到声学特征向量;对于每一条初始音频数据,基于所述声学特征向量从所述向量量化模块中匹配得到目标码本向量,作为该初始音频数据对应的离散音频特征。这样,根据初始音频数据的声学特征向量自适应选择不同的目标码本向量作为离散音频特征,能够更好地平衡资源,同时提升后续利用离散音频特征进行音频生成的生成质量,解决了传统固定码本带来的资源浪费或质量不足的问题。
技术关键词
音频特征生成方法
分词器训练方法
数据
样本
编码器
音频特征提取
文本特征向量
输入解码器
训练装置
生成装置
融合策略
参数
模型训练模块
数值
系统为您推荐了相关专利信息
防暴枪
机器学习模型
电子围栏
特征工程技术
管理方法
整数规划模型
自动建模方法
大语言模型
神经网络模型
数据
设备运行数据
风险
设备实时状态
管理方法
设备健康状态