一种语音token抽取方法及语音处理方法

正文

推荐专利

申请号：CN202411966054

申请日期：2024-12-30

公开号：CN119724231B

公开日期：2025-12-26

类型：发明专利

摘要

本申请提供一种语音token抽取方法及语音处理方法，涉及语音token提取技术领域，所述抽取方法包括获取音频数据，对所述音频数据进行预处理，得到频域特征；将所述频域特征导入语音token抽取模型进行语音token提取，得到若干组语音token；所述语音token抽取模型包括音频编码层以及残差向量量化层；所述音频编码层被配置为根据所述频域特征进行特征编码，得到编码特征；所述残差向量量化层被配置为根据所述编码特征进行分割式残差量化处理。本申请通过上述方法解决了现有提取语音token技术提取的语音token提取组过多的问题。

技术关键词

频域特征编码特征语音音频编码音频解码网络单元数据注意力层叠结构序列端口通道算法尺寸

系统为您推荐了相关专利信息

一种用于语音分离和目标语音提取的通用模型

语音线索递归神经网络模块傅里叶变换处理

基于多模态感知的虚拟角色交互设计生成方法

设计生成方法执行误差多模态对象手机终端

一种基于多通道数据的旋转机械故障诊断方法及系统

故障诊断模型多通道多尺度卷积神经网络信号通道注意力机制

客服语音交互方法、电子设备及存储介质

语音交互方法音频客服业务处理结果噪声功率谱

一种增强边界感知的全波形反演方法

波形反演方法地震波形反演解码模块卷积特征编码模块

一种语音token抽取方法及语音处理方法

站点导航

APP 下载