基于语义通信的视频传输方法、装置、设备、介质及程序

AITNT
正文
推荐专利
基于语义通信的视频传输方法、装置、设备、介质及程序
申请号:CN202410909894
申请日期:2024-07-08
公开号:CN118890492A
公开日期:2024-11-01
类型:发明专利
摘要
本申请公开了一种基于语义通信的视频传输方法、装置、设备、介质及程序,视频发送端获取自然语言指令和视频采集帧,通过多态目标跟踪模型和多态理解模型,基于自然语言指令对视频采集帧中特定的目标及目标的行为状态进行跟踪,基于目标的跟踪预测结果和时序预测结果生成语义文本信息,以基于语义文本信息生成视频。根据本申请实施例,通过提供特定事件自然语言指令,即可得到需要关注、跟踪的目标对象在视频下的跟踪预测结果和行为时序预测结果,从而完成对视频关注对象的实时完整描述,为恢复视频提供准确有效的语义文本信息,有效减少恢复视频产生的幻觉现象。
技术关键词
视频传输方法 自然语言 注意力模型 视频接收端 语义 计算机程序指令 时序 视频传输装置 多头注意力机制 文本 发送端 计算机程序产品 电子设备 解码器 网络结构 编码器 可读存储介质
系统为您推荐了相关专利信息
1
一种基于规则的自动化数据治理系统及方法
实时业务 关键词 实时数据 数据治理系统 数据治理方法
2
基于视频特征提取与多维度匹配的短剧广告实时推送系统
视频特征提取 广告特征 推送系统 支持跨平台 数字广告技术
3
一种三余度飞控系统的可靠性和MTBF分析方法
飞控系统 模型检验方法 数学模型 自动机 抽样方法
4
一种摩崖石刻病害自动监测系统及方法
自动监测方法 特征金字塔网络 区域建议网络 自动监测系统 生成多尺度
5
一种车辆的位姿数据更新方法、装置及车辆
里程计 语义标签 坐标点 地图匹配 GNSS数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号