摘要
本发明公开了一种音频辅助人脸视频编码方法,包括以下步骤;步骤1:对于输入的视频,使用视频编码器进行编码,得到对应码流,记为Vbit;步骤2:对于输入的音频,使用音频编码器进行编码,得到对应码流,记为Abit;步骤3:使用音频解码器对音频码流Abit进行解码,以生成音频文件;步骤4:视频解码器利用所述音频文件和视频码流Vbit进行解码,生成视频文件以供播放。本发明在编解码的过程中就利用音频与视频之间的语义相关性,能够更加充分的利用这种相关性,不仅减小了所需要传输的码流,还可以提升人脸视频的主观和客观质量。
技术关键词
视频编码方法
关键帧
辅助人脸
音频特征提取
音频编码器
生成音频文件
生成视频文件
音频解码器
特征提取网络
视频解码器
视频编码器
机器学习模型
音频解码方法
音频编码方法
注意力机制
系统为您推荐了相关专利信息
可视化特征
识别方法
生成对抗网络模型
样本
步态特征
检测评价方法
关键帧
信令
视频监控系统
抓取网络数据包