一种音频辅助人脸视频编码方法

正文

推荐专利

一种音频辅助人脸视频编码方法

申请号：CN202410879517

申请日期：2024-07-02

公开号：CN118678083A

公开日期：2024-09-20

类型：发明专利

摘要

本发明公开了一种音频辅助人脸视频编码方法，包括以下步骤；步骤1：对于输入的视频，使用视频编码器进行编码，得到对应码流，记为Vbit；步骤2：对于输入的音频，使用音频编码器进行编码，得到对应码流，记为Abit；步骤3：使用音频解码器对音频码流Abit进行解码，以生成音频文件；步骤4：视频解码器利用所述音频文件和视频码流Vbit进行解码，生成视频文件以供播放。本发明在编解码的过程中就利用音频与视频之间的语义相关性，能够更加充分的利用这种相关性，不仅减小了所需要传输的码流，还可以提升人脸视频的主观和客观质量。

技术关键词

视频编码方法关键帧辅助人脸音频特征提取音频编码器生成音频文件生成视频文件音频解码器特征提取网络视频解码器视频编码器机器学习模型音频解码方法音频编码方法注意力机制

系统为您推荐了相关专利信息

基于决策树模型与优选特征的鸡体质量估测方法

分割掩模决策树模型估测方法深度图学习器

一种基于卷积神经网络的野生动物识别方法

可视化特征识别方法生成对抗网络模型样本步态特征

一种监控视频质量检测评价方法

检测评价方法关键帧信令视频监控系统抓取网络数据包

视频处理方法、装置、电子设备及存储介质

关键帧情感类别音乐音频特征数据

基于切向流技术的传染性脾肾坏死病毒侦测方法及系统

轮廓特征侦测方法图像识别模型监测设备指数

一种音频辅助人脸视频编码方法

站点导航

APP 下载