摘要
本申请提供一种语音token抽取方法及语音处理方法,涉及语音token提取技术领域,所述抽取方法包括获取音频数据,对所述音频数据进行预处理,得到频域特征;将所述频域特征导入语音token抽取模型进行语音token提取,得到若干组语音token;所述语音token抽取模型包括音频编码层以及残差向量量化层;所述音频编码层被配置为根据所述频域特征进行特征编码,得到编码特征;所述残差向量量化层被配置为根据所述编码特征进行分割式残差量化处理。本申请通过上述方法解决了现有提取语音token技术提取的语音token提取组过多的问题。
技术关键词
频域特征
编码特征
语音
音频编码
音频解码
网络单元
数据
注意力
层叠结构
序列
端口
通道
算法
尺寸
系统为您推荐了相关专利信息
故障诊断模型
多通道
多尺度卷积神经网络
信号
通道注意力机制
语音交互方法
音频
客服
业务处理结果
噪声功率谱
波形反演方法
地震波形反演
解码模块
卷积特征
编码模块