基于网络模型的直播人声音调自适应调整方法

AITNT
正文
推荐专利
基于网络模型的直播人声音调自适应调整方法
申请号:CN202510603601
申请日期:2025-05-12
公开号:CN120126494B
公开日期:2025-07-15
类型:发明专利
摘要
本发明提供了一种基于网络模型的直播人声音调自适应调整方法,涉及音频信号处理技术领域,其通过短时能量函数的突变点和过零率的异常变化点确定丢包的精确起始位置和结束位置,从而针对性的利用基频轨迹特征和共振峰特征对丢包区间修复。本发明中的方法可以解决传统语音修复方法在高丢包率场景中因声学参数解耦修复与实时处理约束的矛盾,导致基频轨迹断裂和语音不自然的问题,从而实现丢包语音的高精度、低延时自适应修复,显著提高直播场景下声音质量与用户体验。
技术关键词
轨迹特征 频谱特征 三次样条插值 轮廓特征 网络 音频信号处理技术 包络 OTSU算法 线性预测系数 皮尔逊相关系数 动态规划算法 滑动窗口 连续性 分布直方图 谐波结构 序列 参数 非线性
系统为您推荐了相关专利信息
1
基于数据和物理依次驱动的声场云图预测网络训练方法
网络训练方法 物理 网络应用方法 数据 仿真模型
2
一种尿液图像智能分割模型与特征提取算法
特征提取算法 联合损失函数 权重分配策略 双分支卷积神经网络 可见光图像
3
基于多生物特征信息比对的精子库身份验证方法及系统
生物特征信息 身份验证系统 信息比 图谱 身份验证方法
4
储能电站的电池热失控预警方法、装置、设备及介质
储能电站 电池热失控 预警方法 池化特征 标签
5
一种基于量子经典混合卷积神经网络的放疗剂量预测方法
混合卷积神经网络 剂量预测方法 生成距离图像 编码器 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号