摘要
本申请公开了一种音频修复方法、装置及电子设备,属于人工智能技术领域。该方法包括对待修复的第一音频片段、第一音频片段的上文音频片段和下文音频片段进行特征提取,得到第一音频片段的第一声学特征向量、上文音频片段的第二声学特征向量和下文音频片段的第三声学特征向量;将第一声学特征向量、第二声学特征向量和第三声学特征向量输入音频大模型,通过音频大模型进行自回归预测,得到预测离散编码向量,并对预测离散编码向量进行解码,得到修复后的第二音频片段。
技术关键词
编码向量
样本
序列
人声
子模块
意图
语音
音频修复方法
变量
模型训练模块
解码器
编辑界面
重构
声码器
客户端
三元组
控件
编码器