摘要
本发明涉及一种基于小波矫正学习的指代视频目标分割方法及系统,方法包括以下步骤:获取视频数据和文本数据,分别提取得到高维视觉特征、低维视觉特征、初始单词特征和语句特征;将初始单词特征进行矫正,并感知给定视觉特征的语义实体信息;提取高维视觉特征的高维小波特征和低维小波特征,并进行细化处理,分析得到像素空间映射;将语义实体信息和像素空间映射融合,得到增强的高维视觉特征,并结合实例查询得到预测实例;根据预测实例生成预测头,通过预测头进行目标实体分割,得到预测轨迹;采用匈牙利算法将预测轨迹和真实目标序列匹配,得到目标分割结果。与现有技术相比,本发明显著提升了实体识别的准确性,解决了分割细节不完整的问题。
技术关键词
视觉特征
小波特征
语义实体
分割方法
矫正
离散小波变换
视频
匈牙利算法
上下文特征
像素
文本
语句
数据获取模块
编码器
轨迹
滤波
跨模态
矩阵
系统为您推荐了相关专利信息
小尺寸物体
图像探测器
数据处理单元
可编程云台
阴影特征
桥梁裂缝图像
语义分割方法
空间金字塔池化
融合特征
语义分割模型
伺服送丝装置
焊接机器人
立板
压紧组件
涨紧组件