一种基于Swin Transformer的交通视频文本跟踪方法

AITNT
正文
推荐专利
一种基于Swin Transformer的交通视频文本跟踪方法
申请号:CN202410957474
申请日期:2024-07-17
公开号:CN119206693A
公开日期:2024-12-27
类型:发明专利
摘要
本发明公开了一种基于Swin Transformer的交通视频文本跟踪方法,特点是利用前后帧的图像中文本的关联性,通过DropMAE模块恢复被遮挡的文本,接着通过可形变文本检测模块为模型提供了灵活的感受野,再结合空间注意力机制融合不同尺度的第二检测特征图像,接着在文本匹配时结合了文本实例的视觉特征、语义特征以及几何特征,获取文本相似度邻接矩阵,最后将文本实例图像关联至视频文本跟踪过程中具有文本关联的最小距离的文本实例图像所形成的目标文本轨迹;优点是解决文本的漏检问题,能准确捕捉文本实例的边界,提升模糊变形文本实例的检测精确度,对目标交通视频的文本检测跟踪性能较佳。
技术关键词
文本 图像 语义特征 视觉特征 跟踪方法 匹配模块 视频 交通 注意力机制 分支 网络 级联 编码器方法 上采样 融合特征 双线性 匈牙利算法
系统为您推荐了相关专利信息
1
通过井盖时的车辆控制方法、装置、设备和存储介质
井盖 车辆控制方法 车轮尺寸 控制策略模型 数据
2
一种变电设备红外图像分析及诊断方法与相关设备
变电设备温度 变电设备运行状态 图像分析 诊断方法 多模态数据采集
3
一种基于外部知识的大模型输出生成方法、介质及设备
大语言模型 数据知识库 生成方法 置信度阈值 文本
4
一种播放器皮肤的生成方法、设备及存储介质
生成方法 播放器 视觉 图像识别模型 元素
5
基于AI技术的生产质量实时监控与优化管理方法
优化管理方法 管理特征 监测点 规划 指数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号