摘要
本发明实施例提供一种支持动态帧率的语音编码模型训练方法及系统。该方法包括:构建基于固定帧率语音编码的基础模型,基础模型接收动态帧率语音,输出第一连续特征表示;对基础模型进行熔化‑冷却的阶段训练,在熔化阶段训练中,通过分段语音长度比例分布将第一连续特征表示重新构造为第二连续特征表示,得到训练后支持多种下采样方案的动态帧率基础模型;在冷却阶段训练中,利用动态帧率调度器通过动态规划确定动态帧率基础模型的最优下采样方案,基于最优下采样方案对动态帧率基础模型调整训练,得到带有具备动态帧率支持能力编码器的语音编码模型。本发明实施例引入动态帧率下采样模块,显著提升了神经语音编解码器的压缩效率与重构质量。
技术关键词
动态帧率
连续特征
语音编码
基础
模型训练方法
分段
调度器
编码器
阶段
计算机程序产品
重构
语音编解码器
模型训练系统
规划
采样器
处理器通信
系统为您推荐了相关专利信息
测试场景
自动驾驶系统
模型构建方法
综合评价指标
案例库
新能源车辆
控制策略
深度强化学习算法
热系统
云端
失效预警方法
卷积神经网络模型
实体
三元组
图谱
网络结构规划方法
配电网拓扑
电网规划技术
核心
历史负荷数据