摘要
本发明公开了一种多模态协同的视频序列分割方法,步骤包括:获得图像序列的多尺度局部特征矩阵以及多尺度全局特征矩阵;获得文本序列的多尺度文本特征矩阵;获得多尺度局部特征矩阵以及多尺度全局特征矩阵的多尺度局部‑全局融合特征矩阵;获得多尺度局部‑全局融合特征矩阵以及多尺度文本特征矩阵的多模态融合特征矩阵;利用预训练大模型的解码器来预测生成分割掩码,输出语义分割图。该视频序列分割方法在面对复杂多变的场景时表现稳定,无需依赖大量标注数据,降低了训练成本,适用于多种实际应用领域,包括智能监控、自动驾驶及医学影像分析等。
技术关键词
视频序列分割方法
融合特征
融合专家
多尺度局部特征
矩阵
多模态协同
全局特征提取
语义特征提取
局部特征提取
时序
深度卷积神经网络
图像
文本编码器
混合专家网络
解码器
分支
系统为您推荐了相关专利信息
级联失效模型
天气
计算机程序指令
损失率
公交站点
无扰控制方法
容错控制器
动力定位系统
故障容错
传感器
终端设备
匈牙利算法
设备参数信息
负载均衡算法
任务分配策略
全景环视图像
辅助驾驶方法
鱼眼摄像头
畸变模型
消除拼接缝隙
故障诊断模型
模糊宽度学习
子系统
数据
机电设备故障诊断