摘要
本发明实施例公开了一种音频信号处理方法、装置、电子设备和存储介质,该方法包括:接收到用户发送的开始指令时,响应于开始指令获取当前时刻的至少一个人声音频信息;基于预先获取到的音效指导文本和当前时刻的各人声音频信息,得到当前时刻的目标人声音频信息;根据当前时刻的目标人声音频信息和预先确定的当前时刻的背景音频信息确定当前时刻的目标音频信息;基于目标音频信息生成并播放目标音频。本发明中,通过实时灵活地调整文本演绎场景中的人声音频信息以匹配场景变化,能够灵活应对演出过程中的细微变化和情感波动,使音频内容更加贴合实际演绎情况,提高用户整体的听觉体验和沉浸感。
技术关键词
音频信号处理方法
音效
场景
音频信号处理装置
文本
情感分析模型
音频播放模块
电子设备
指令
处理器
时间段
计算机程序产品
可读存储介质
存储器
听觉
系统为您推荐了相关专利信息
拥塞控制算法
大语言模型
拥塞控制系统
序列
文本
样本生成方法
混合损失函数
深度学习模型
图像
丢弃方法
分子
活性材料
前馈神经网络
非暂态计算机可读存储介质
电池
实体关系抽取
信息生成方法
决策
训练集
机器可读指令
语音识别方法
表达序列
解码器
声学特征
文本编码器