摘要
本公开提供了一种音频转码方法、装置、电子设备、存储介质和程序产品,涉及音频处理技术领域。其中,音频转码方法包括:响应于获取到的原始音频流,检测原始音频流的音频内容类型和源流音量;基于与原始音频流的时间戳的对齐操作,将音频内容类型和源流音量添加至原始音频流,得到增强音频流;基于源流音量和参考音量之间的关系确定转码音频流的目标音量,其中,在转码过程中检测到出现音频内容类型的切换时,基于切换前的第一源流音量调整切换后的第二源流音量,以基于调整后的第二源流音量和参考音量之间的关系确定目标音量。通过本公开的技术方案,在转码过程中动态不断流地调整音量,保持不同场景切换时音量的一致性,提升了用户的视听体验。
技术关键词
音频转码方法
音频转码装置
音频特征
噪音功能
电子设备
关系
处理器
音频采样
深度学习模型
大数据
计算机程序产品
频域特征
数据模块
场景
可读存储介质
曲线
视听