支持动态帧率的语音编码模型训练方法及系统

正文

推荐专利

申请号：CN202510769244

申请日期：2025-06-10

公开号：CN120412607A

公开日期：2025-08-01

类型：发明专利

摘要

本发明实施例提供一种支持动态帧率的语音编码模型训练方法及系统。该方法包括：构建基于固定帧率语音编码的基础模型，基础模型接收动态帧率语音，输出第一连续特征表示；对基础模型进行熔化‑冷却的阶段训练，在熔化阶段训练中，通过分段语音长度比例分布将第一连续特征表示重新构造为第二连续特征表示，得到训练后支持多种下采样方案的动态帧率基础模型；在冷却阶段训练中，利用动态帧率调度器通过动态规划确定动态帧率基础模型的最优下采样方案，基于最优下采样方案对动态帧率基础模型调整训练，得到带有具备动态帧率支持能力编码器的语音编码模型。本发明实施例引入动态帧率下采样模块，显著提升了神经语音编解码器的压缩效率与重构质量。

技术关键词

动态帧率连续特征语音编码基础模型训练方法分段调度器编码器阶段计算机程序产品重构语音编解码器模型训练系统规划采样器处理器通信

系统为您推荐了相关专利信息

一种面向心内科超声心动图的自动分割方法及系统

像素点超声心动图噪声自动分割方法组织

一种自动驾驶系统预期功能安全测试评价模型构建方法

测试场景自动驾驶系统模型构建方法综合评价指标案例库

新能源热系统的控制方法及装置

新能源车辆控制策略深度强化学习算法热系统云端

一种城市轨道交通网络客流分布计算失效预警方法

失效预警方法卷积神经网络模型实体三元组图谱

电网的网络结构规划方法

网络结构规划方法配电网拓扑电网规划技术核心历史负荷数据

支持动态帧率的语音编码模型训练方法及系统

站点导航

APP 下载