一种视觉可控的编码端深度学习视频压缩控制方法

AITNT
正文
推荐专利
一种视觉可控的编码端深度学习视频压缩控制方法
申请号:CN202411622248
申请日期:2025-02-14
公开号:CN119629360A
公开日期:2025-03-14
类型:发明专利
摘要
本发明公开了一种视觉可控的编码端深度学习视频压缩控制方法,包括:预训练针对人眼视觉优化的深度学习编解码器,并冻结模型参数,形成编码端;在编码端加入编码模式预测策略,针对下游任务进行训练优化,获得优化后的编码模式预测模型;对编码模式预测模型进行模型训练,训练完成后引入编码帧结构预测模型,面向下游任务继续进行训练,获得集成编码模式预测和编码帧结构预测的视频编解码器,基于视频编解码器实现视频解压缩。本发明在编码端通过编码模式预测、编码帧结构预测等技术,实现编码器对多种下游任务的支持,同时无需改变原有编解码器的权重和解码流程,降低了编解码流程和部署应用的复杂度。
技术关键词
视觉可控 残差卷积神经网络 视频编解码器 视频压缩 模式 视频动作识别 编码特征 视频分析 图片 元素 策略 掩膜 下游机器 人眼 视频编码器
系统为您推荐了相关专利信息
1
基于FMEA模型的提高腹腔镜胆囊切除安全性的方法及装置
腹腔镜胆囊切除术 腹腔镜系统 日间病房 数据输入模块 失效原因分析
2
半導體製程設備及最優阻抗值獲取方法、掃頻匹配方法
阻抗匹配器 列表 功率 控制器 程序
3
一种基于拓扑数据分析的食道癌手术动态风险评估方法
拓扑特征 动态风险评估方法 食道癌手术 生成对抗网络模型 编码器
4
一种基于多元算法融合的反窃查违智能识别方法
智能识别方法 非线性特征 耦合特征 设备运行状态数据 融合特征
5
一种基于混合现实的机械臂示教方法
机械臂示教方法 混合现实眼镜 机械臂关节 机械臂控制器 笛卡尔
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号