一种音频辅助人脸视频编码方法

AITNT
正文
推荐专利
一种音频辅助人脸视频编码方法
申请号:CN202410879517
申请日期:2024-07-02
公开号:CN118678083A
公开日期:2024-09-20
类型:发明专利
摘要
本发明公开了一种音频辅助人脸视频编码方法,包括以下步骤;步骤1:对于输入的视频,使用视频编码器进行编码,得到对应码流,记为Vbit;步骤2:对于输入的音频,使用音频编码器进行编码,得到对应码流,记为Abit;步骤3:使用音频解码器对音频码流Abit进行解码,以生成音频文件;步骤4:视频解码器利用所述音频文件和视频码流Vbit进行解码,生成视频文件以供播放。本发明在编解码的过程中就利用音频与视频之间的语义相关性,能够更加充分的利用这种相关性,不仅减小了所需要传输的码流,还可以提升人脸视频的主观和客观质量。
技术关键词
视频编码方法 关键帧 辅助人脸 音频特征提取 音频编码器 生成音频文件 生成视频文件 音频解码器 特征提取网络 视频解码器 视频编码器 机器学习模型 音频解码方法 音频编码方法 注意力机制
系统为您推荐了相关专利信息
1
基于决策树模型与优选特征的鸡体质量估测方法
分割掩模 决策树模型 估测方法 深度图 学习器
2
一种基于卷积神经网络的野生动物识别方法
可视化特征 识别方法 生成对抗网络模型 样本 步态特征
3
一种监控视频质量检测评价方法
检测评价方法 关键帧 信令 视频监控系统 抓取网络数据包
4
视频处理方法、装置、电子设备及存储介质
关键帧 情感类别 音乐 音频特征 数据
5
基于切向流技术的传染性脾肾坏死病毒侦测方法及系统
轮廓特征 侦测方法 图像识别模型 监测设备 指数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号