自适应视觉-语言匹配检测与跟踪方法

正文

推荐专利

自适应视觉-语言匹配检测与跟踪方法

申请号：CN202511047813

申请日期：2025-07-29

公开号：CN120563868B

公开日期：2025-09-23

类型：发明专利

摘要

本发明属于计算机视觉、视觉‑语言匹配检测、多模态目标跟踪领域，公开了一种自适应视觉‑语言匹配检测与跟踪方法。首先利用预训练多模态大模型的模态对齐与表征优势，构建视觉‑语言多模态跟踪大模型；并提出视觉上下文感知提示学习算法，从当前搜索特征中提取视觉上下文特征，采用提示学习将其融入文本编码过程，实现文本特征对视觉变化的动态感知；此外，设计语言自适应隐式更新机制，通过在文本编码过程中嵌入可学习向量，并结合动态的视觉上下文线索，实现在跟踪过程中对文本特征的隐式更新，使静态语言能够动态匹配视觉外观，从而提升视觉‑语言检测跟踪性能。

技术关键词

文本编码器搜索特征图像编码器上下文特征多模态模板特征跟踪方法提示器分支分词模块参数计算机视觉注意力学习算法

系统为您推荐了相关专利信息

弹片连接器全自动光学检测与分拣方法及系统

弹片连接器分拣方法系统运行状态支持向量机算法轮廓参数

基于多模态重构融合的锂离子电池热失控预警方法及系统

锂离子电池热失控频域特征时域特征预警方法多模态

一种胸痛智能分诊方法及系统

智能分诊方法患者病情信息胸痛图谱强化学习算法

一种基于强化学习的疏浚船自主路径规划方法

自主路径规划方法疏浚船反射光谱数据三维地形数据数字孪生

一种人工智能辅助的术中成像方法、系统和存储介质

人工智能辅助多模态医学影像成像方法强化学习模型图像分割识别

自适应视觉-语言匹配检测与跟踪方法

站点导航

APP 下载