基于自然语言引导的场景自适应视频压缩方法及系统

正文

推荐专利

申请号：CN202411434942

申请日期：2024-10-15

公开号：CN118972590B

公开日期：2024-12-17

类型：发明专利

摘要

本发明公开了一种基于自然语言引导的场景自适应视频压缩方法及系统，该方法包括获取原始视频数据流，解析为连续的视频帧序列；获取与场景相关的自然语言引导文本，确定当前场景的类型，生成增强后的场景描述文本；使用场景分类系统进行深度分析，生成场景特征向量；与预训练的大语言模型结合，生成优化策略；提取局部和全局特征，生成综合特征图；进行运动估计，生成运动向量和残差信息；融和生成复合特征图；使用分水岭算法生成掩膜；对复合特征图进行自适应压缩，输出特征数据；采用上下文自适应二进制算术编码进行进一步的数据压缩，输出压缩数据比特流。本发明提升了视频压缩的效率和压缩后视频的质量，实现了在不同场景下的智能视频压缩。

技术关键词

视频压缩方法自然语言场景二进制算术编码语义特征残差数据文本特征向量比特流分水岭算法语义向量残差系数运动特征错误恢复能力运动向量数据视频帧冗余校验位残差信息

基于自然语言引导的场景自适应视频压缩方法及系统

站点导航

APP 下载