摘要
本发明公开了一种语义分析模型训练方法、视频数据传输方法、电子设备及计算机可读存储介质,属于人工智能与视频传输技术领域。该训练方法基于MobileViT‑S架构构建多任务融合网络,结合轻量化Transformer与卷积模块,同步提取视频中的目标、动作及场景语义信息。训练采用两阶段策略:预训练阶段使用通用数据集优化基础能力;微调阶段引入课程学习与时序平滑损失,逐步增加复杂海洋场景样本权重,联合优化多任务损失函数,动态调整权重平衡精度与带宽适配。船端部署该模型提取结构化语义信息;岸基通过GAN+Diffusion模型还原视频,结合光流插值、Kalman滤波提升时序一致性。由此解决了低带宽场景下视频实时传输难题,可应用于船舶监控、远程协作等领域,显著提升传输效率与可靠性。
技术关键词
语义分析模型
视频数据传输方法
时空注意力机制
动态特征选择
分支
场景分类
联合损失函数
电子设备
Kalman滤波
多任务损失函数
全局特征融合
视频传输技术
可读存储介质
时序依赖关系
阶段