摘要
本发明公开了一种基于自然语言引导的场景自适应视频压缩方法及系统,该方法包括获取原始视频数据流,解析为连续的视频帧序列;获取与场景相关的自然语言引导文本,确定当前场景的类型,生成增强后的场景描述文本;使用场景分类系统进行深度分析,生成场景特征向量;与预训练的大语言模型结合,生成优化策略;提取局部和全局特征,生成综合特征图;进行运动估计,生成运动向量和残差信息;融和生成复合特征图;使用分水岭算法生成掩膜;对复合特征图进行自适应压缩,输出特征数据;采用上下文自适应二进制算术编码进行进一步的数据压缩,输出压缩数据比特流。本发明提升了视频压缩的效率和压缩后视频的质量,实现了在不同场景下的智能视频压缩。
技术关键词
视频压缩方法
自然语言
场景
二进制算术编码
语义特征
残差数据
文本特征向量
比特流
分水岭算法
语义向量
残差系数
运动特征
错误恢复能力
运动向量数据
视频帧
冗余校验位
残差信息