基于语义流的实时高保真视频传输的多模态方法

AITNT
正文
推荐专利
基于语义流的实时高保真视频传输的多模态方法
申请号:CN202510213570
申请日期:2025-02-26
公开号:CN119728994B
公开日期:2025-06-06
类型:发明专利
摘要
本发明实施例涉及视频传输技术领域,具体公开了基于语义流的实时高保真视频传输的多模态方法。本发明实施例通过接收多帧视频序列,通过时空压缩器提取空间和时间相关性,输出潜在表示;通过语义翻译器,将潜在表示映射到语义空间,逐步转化视觉特征和文本特征;通过预设的Transformer融合模型,将潜在表示和文本特征进行多模态融合,输出融合表示;通过预设的码本模型,将融合表示量化为量化表示;通过视频控制网,对量化表示和文本特征进行处理,生成重构视频序列。能够显著提高压缩效率,且实现对关键语义信息的优先级传输,从而在带宽受限条件下保持高效压缩和感知相关性,并能够确保视频内容语义一致性和时间连贯性。
技术关键词
高保真视频 重构视频序列 视觉特征 表达式 文本 翻译器 压缩器 参数 视频传输技术 多模态 解码器 代表 语义特征 空间结构 上采样 动态
系统为您推荐了相关专利信息
1
一种基于人工智能大模型的客户服务营销数据分析方法
数据分析方法 时间序列预测模型 模型分析技术 客户服务效率 智能客服系统
2
通话检测预警方法、装置、设备及存储介质
检测预警方法 情绪特征 号码 关键词 语音识别技术
3
文本检索3D模型数据集的构建方法、计算机程序产品及电子设备
文本 数据 代表 聚类 计算机程序产品
4
基于振动传感数据的大坝安全监测与裂缝预测方法及系统
裂缝预测方法 大坝 注意力机制 网络 协方差矩阵
5
包含不确定性传播飞行器任务能力评估方法、设备及介质
飞行器 能力评估方法 在线轨迹规划 能力评估技术 点云模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号