基于语义流的实时高保真视频传输的多模态方法

正文

推荐专利

申请号：CN202510213570

申请日期：2025-02-26

公开号：CN119728994B

公开日期：2025-06-06

类型：发明专利

摘要

本发明实施例涉及视频传输技术领域，具体公开了基于语义流的实时高保真视频传输的多模态方法。本发明实施例通过接收多帧视频序列，通过时空压缩器提取空间和时间相关性，输出潜在表示；通过语义翻译器，将潜在表示映射到语义空间，逐步转化视觉特征和文本特征；通过预设的Transformer融合模型，将潜在表示和文本特征进行多模态融合，输出融合表示；通过预设的码本模型，将融合表示量化为量化表示；通过视频控制网，对量化表示和文本特征进行处理，生成重构视频序列。能够显著提高压缩效率，且实现对关键语义信息的优先级传输，从而在带宽受限条件下保持高效压缩和感知相关性，并能够确保视频内容语义一致性和时间连贯性。

技术关键词

高保真视频重构视频序列视觉特征表达式文本翻译器压缩器参数视频传输技术多模态解码器代表语义特征空间结构上采样动态

系统为您推荐了相关专利信息

一种基于人工智能大模型的客户服务营销数据分析方法

数据分析方法时间序列预测模型模型分析技术客户服务效率智能客服系统

通话检测预警方法、装置、设备及存储介质

检测预警方法情绪特征号码关键词语音识别技术

文本检索3D模型数据集的构建方法、计算机程序产品及电子设备

文本数据代表聚类计算机程序产品

基于振动传感数据的大坝安全监测与裂缝预测方法及系统

裂缝预测方法大坝注意力机制网络协方差矩阵

包含不确定性传播飞行器任务能力评估方法、设备及介质

飞行器能力评估方法在线轨迹规划能力评估技术点云模型

基于语义流的实时高保真视频传输的多模态方法

站点导航

APP 下载