摘要
本发明公开了一种视觉可控的编码端深度学习视频压缩控制方法,包括:预训练针对人眼视觉优化的深度学习编解码器,并冻结模型参数,形成编码端;在编码端加入编码模式预测策略,针对下游任务进行训练优化,获得优化后的编码模式预测模型;对编码模式预测模型进行模型训练,训练完成后引入编码帧结构预测模型,面向下游任务继续进行训练,获得集成编码模式预测和编码帧结构预测的视频编解码器,基于视频编解码器实现视频解压缩。本发明在编码端通过编码模式预测、编码帧结构预测等技术,实现编码器对多种下游任务的支持,同时无需改变原有编解码器的权重和解码流程,降低了编解码流程和部署应用的复杂度。
技术关键词
视觉可控
残差卷积神经网络
视频编解码器
视频压缩
模式
视频动作识别
编码特征
视频分析
图片
元素
策略
掩膜
下游机器
人眼
视频编码器
系统为您推荐了相关专利信息
腹腔镜胆囊切除术
腹腔镜系统
日间病房
数据输入模块
失效原因分析
拓扑特征
动态风险评估方法
食道癌手术
生成对抗网络模型
编码器
智能识别方法
非线性特征
耦合特征
设备运行状态数据
融合特征
机械臂示教方法
混合现实眼镜
机械臂关节
机械臂控制器
笛卡尔