一种视觉可控的编码端深度学习视频压缩控制方法

正文

推荐专利

申请号：CN202411622248

申请日期：2025-02-14

公开号：CN119629360A

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了一种视觉可控的编码端深度学习视频压缩控制方法，包括：预训练针对人眼视觉优化的深度学习编解码器，并冻结模型参数，形成编码端；在编码端加入编码模式预测策略，针对下游任务进行训练优化，获得优化后的编码模式预测模型；对编码模式预测模型进行模型训练，训练完成后引入编码帧结构预测模型，面向下游任务继续进行训练，获得集成编码模式预测和编码帧结构预测的视频编解码器，基于视频编解码器实现视频解压缩。本发明在编码端通过编码模式预测、编码帧结构预测等技术，实现编码器对多种下游任务的支持，同时无需改变原有编解码器的权重和解码流程，降低了编解码流程和部署应用的复杂度。

技术关键词

视觉可控残差卷积神经网络视频编解码器视频压缩模式视频动作识别编码特征视频分析图片元素策略掩膜下游机器人眼视频编码器

系统为您推荐了相关专利信息

基于FMEA模型的提高腹腔镜胆囊切除安全性的方法及装置

腹腔镜胆囊切除术腹腔镜系统日间病房数据输入模块失效原因分析

半導體製程設備及最優阻抗值獲取方法、掃頻匹配方法

阻抗匹配器列表功率控制器程序

一种基于拓扑数据分析的食道癌手术动态风险评估方法

拓扑特征动态风险评估方法食道癌手术生成对抗网络模型编码器

一种基于多元算法融合的反窃查违智能识别方法

智能识别方法非线性特征耦合特征设备运行状态数据融合特征

一种基于混合现实的机械臂示教方法

机械臂示教方法混合现实眼镜机械臂关节机械臂控制器笛卡尔

一种视觉可控的编码端深度学习视频压缩控制方法

站点导航

APP 下载