一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置

AITNT
正文
推荐专利
一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置
申请号:CN202511124479
申请日期:2025-08-12
公开号:CN120748434A
公开日期:2025-10-03
类型:发明专利
摘要
本申请提供了一种本申请实施例提供的一种离散音频特征生成方法及装置、音频数据分词器训练方法及装置,所述离散音频特征生成方法基于音频数据分词器实现,所述向量量化模块中包括多个码本,每个码本包括多个码本向量;所述生成方法包括:将初始音频数据输入所述编码器,得到声学特征向量;对于每一条初始音频数据,基于所述声学特征向量从所述向量量化模块中匹配得到目标码本向量,作为该初始音频数据对应的离散音频特征。这样,根据初始音频数据的声学特征向量自适应选择不同的目标码本向量作为离散音频特征,能够更好地平衡资源,同时提升后续利用离散音频特征进行音频生成的生成质量,解决了传统固定码本带来的资源浪费或质量不足的问题。
技术关键词
音频特征生成方法 分词器训练方法 数据 样本 编码器 音频特征提取 文本特征向量 输入解码器 训练装置 生成装置 融合策略 参数 模型训练模块 数值
系统为您推荐了相关专利信息
1
基于情感识别的明星偶像多模态响应系统
粉丝 多模态响应 社交 语义关键词 媒体
2
一种基于北斗定位的防暴枪防丢失管理系统、方法和平台
防暴枪 机器学习模型 电子围栏 特征工程技术 管理方法
3
基于大语言模型的整数规划自动建模方法
整数规划模型 自动建模方法 大语言模型 神经网络模型 数据
4
一种日光诱导叶绿素荧光多光谱成像方法及成像系统
多光谱成像方法 样本 标记 分类模型训练 数据
5
一种基于数据分析的设备安全管理系统及其方法
设备运行数据 风险 设备实时状态 管理方法 设备健康状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号