一种语音token抽取方法及语音处理方法

AITNT
正文
推荐专利
一种语音token抽取方法及语音处理方法
申请号:CN202411966054
申请日期:2024-12-30
公开号:CN119724231B
公开日期:2025-12-26
类型:发明专利
摘要
本申请提供一种语音token抽取方法及语音处理方法,涉及语音token提取技术领域,所述抽取方法包括获取音频数据,对所述音频数据进行预处理,得到频域特征;将所述频域特征导入语音token抽取模型进行语音token提取,得到若干组语音token;所述语音token抽取模型包括音频编码层以及残差向量量化层;所述音频编码层被配置为根据所述频域特征进行特征编码,得到编码特征;所述残差向量量化层被配置为根据所述编码特征进行分割式残差量化处理。本申请通过上述方法解决了现有提取语音token技术提取的语音token提取组过多的问题。
技术关键词
频域特征 编码特征 语音 音频编码 音频解码 网络单元 数据 注意力 层叠结构 序列 端口 通道 算法 尺寸
系统为您推荐了相关专利信息
1
一种用于语音分离和目标语音提取的通用模型
语音 线索 递归神经网络 模块 傅里叶变换处理
2
基于多模态感知的虚拟角色交互设计生成方法
设计生成方法 执行误差 多模态 对象 手机终端
3
一种基于多通道数据的旋转机械故障诊断方法及系统
故障诊断模型 多通道 多尺度卷积神经网络 信号 通道注意力机制
4
客服语音交互方法、电子设备及存储介质
语音交互方法 音频 客服 业务处理结果 噪声功率谱
5
一种增强边界感知的全波形反演方法
波形反演方法 地震波形反演 解码模块 卷积特征 编码模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号