一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置

正文

推荐专利

申请号：CN202511124479

申请日期：2025-08-12

公开号：CN120748434A

公开日期：2025-10-03

类型：发明专利

摘要

本申请提供了一种本申请实施例提供的一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置，所述离散音频特征生成方法基于音频数据分词器实现，所述向量量化模块中包括多个码本，每个码本包括多个码本向量；所述生成方法包括：将初始音频数据输入所述编码器，得到声学特征向量；对于每一条初始音频数据，基于所述声学特征向量从所述向量量化模块中匹配得到目标码本向量，作为该初始音频数据对应的离散音频特征。这样，根据初始音频数据的声学特征向量自适应选择不同的目标码本向量作为离散音频特征，能够更好地平衡资源，同时提升后续利用离散音频特征进行音频生成的生成质量，解决了传统固定码本带来的资源浪费或质量不足的问题。

技术关键词

音频特征生成方法分词器训练方法数据样本编码器音频特征提取文本特征向量输入解码器训练装置生成装置融合策略参数模型训练模块数值

系统为您推荐了相关专利信息

基于情感识别的明星偶像多模态响应系统

粉丝多模态响应社交语义关键词媒体

一种基于北斗定位的防暴枪防丢失管理系统、方法和平台

防暴枪机器学习模型电子围栏特征工程技术管理方法

基于大语言模型的整数规划自动建模方法

整数规划模型自动建模方法大语言模型神经网络模型数据

一种日光诱导叶绿素荧光多光谱成像方法及成像系统

多光谱成像方法样本标记分类模型训练数据

一种基于数据分析的设备安全管理系统及其方法

设备运行数据风险设备实时状态管理方法设备健康状态

一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置

站点导航

APP 下载