基于语义通信的视频传输方法、装置、设备、介质及程序

正文

推荐专利

申请号：CN202410909894

申请日期：2024-07-08

公开号：CN118890492A

公开日期：2024-11-01

类型：发明专利

摘要

本申请公开了一种基于语义通信的视频传输方法、装置、设备、介质及程序，视频发送端获取自然语言指令和视频采集帧，通过多态目标跟踪模型和多态理解模型，基于自然语言指令对视频采集帧中特定的目标及目标的行为状态进行跟踪，基于目标的跟踪预测结果和时序预测结果生成语义文本信息，以基于语义文本信息生成视频。根据本申请实施例，通过提供特定事件自然语言指令，即可得到需要关注、跟踪的目标对象在视频下的跟踪预测结果和行为时序预测结果，从而完成对视频关注对象的实时完整描述，为恢复视频提供准确有效的语义文本信息，有效减少恢复视频产生的幻觉现象。

技术关键词

视频传输方法自然语言注意力模型视频接收端语义计算机程序指令时序视频传输装置多头注意力机制文本发送端计算机程序产品电子设备解码器网络结构编码器可读存储介质

系统为您推荐了相关专利信息

一种基于规则的自动化数据治理系统及方法

实时业务关键词实时数据数据治理系统数据治理方法

基于视频特征提取与多维度匹配的短剧广告实时推送系统

视频特征提取广告特征推送系统支持跨平台数字广告技术

一种三余度飞控系统的可靠性和MTBF分析方法

飞控系统模型检验方法数学模型自动机抽样方法

一种摩崖石刻病害自动监测系统及方法

自动监测方法特征金字塔网络区域建议网络自动监测系统生成多尺度

一种车辆的位姿数据更新方法、装置及车辆

里程计语义标签坐标点地图匹配 GNSS数据

基于语义通信的视频传输方法、装置、设备、介质及程序

站点导航

APP 下载