基于网络模型的直播人声音调自适应调整方法

正文

推荐专利

申请号：CN202510603601

申请日期：2025-05-12

公开号：CN120126494B

公开日期：2025-07-15

类型：发明专利

摘要

本发明提供了一种基于网络模型的直播人声音调自适应调整方法，涉及音频信号处理技术领域，其通过短时能量函数的突变点和过零率的异常变化点确定丢包的精确起始位置和结束位置，从而针对性的利用基频轨迹特征和共振峰特征对丢包区间修复。本发明中的方法可以解决传统语音修复方法在高丢包率场景中因声学参数解耦修复与实时处理约束的矛盾，导致基频轨迹断裂和语音不自然的问题，从而实现丢包语音的高精度、低延时自适应修复，显著提高直播场景下声音质量与用户体验。

技术关键词

轨迹特征频谱特征三次样条插值轮廓特征网络音频信号处理技术包络 OTSU算法线性预测系数皮尔逊相关系数动态规划算法滑动窗口连续性分布直方图谐波结构序列参数非线性

系统为您推荐了相关专利信息

基于数据和物理依次驱动的声场云图预测网络训练方法

网络训练方法物理网络应用方法数据仿真模型

一种尿液图像智能分割模型与特征提取算法

特征提取算法联合损失函数权重分配策略双分支卷积神经网络可见光图像

基于多生物特征信息比对的精子库身份验证方法及系统

生物特征信息身份验证系统信息比图谱身份验证方法

储能电站的电池热失控预警方法、装置、设备及介质

储能电站电池热失控预警方法池化特征标签

一种基于量子经典混合卷积神经网络的放疗剂量预测方法

混合卷积神经网络剂量预测方法生成距离图像编码器解码器

基于网络模型的直播人声音调自适应调整方法

站点导航

APP 下载