基于视觉-语言多模态感知的电力设备目标跟踪方法

AITNT
正文
推荐专利
基于视觉-语言多模态感知的电力设备目标跟踪方法
申请号:CN202510352794
申请日期:2025-03-25
公开号:CN120298333A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于视觉‑语言多模态感知的电力设备目标跟踪方法,属于电力设备目标跟踪技术领域,首先,构建了一种语言引导的目标感知多模态外观建模模型,引入语言和视觉信息共同进行目标表征,利用稳定的语言特征选择更有效的视觉特征,结合自注意机制对两种多模态信息进行深度对齐和增强,提高目标模型的适应性。其次,为了更好的分类和回归,提出了一种视觉‑语言多模态联合感知模块,该模块利用稳定的语言特征和语言感知过的有效视觉特征,通过自注意力强相似先验计算,提前去除搜索区域内的非目标标记,提高了跟踪速度和准确性。
技术关键词
电力设备 模板特征 跟踪方法 视觉特征 注意力 多模态信息 交互模型 代表 分支 多模态特征 网络中心 偏差 特征选择 尺寸 编码模块 关系
系统为您推荐了相关专利信息
1
一种基于向量数据库的知识图谱生成方法
知识图谱生成方法 推理机制 生成知识图谱 实体间关系 数据
2
基于图像时频域增强和动态掩码生成网络的强化学习方法
强化学习方法 强化学习网络 强化学习框架 动态 注意力
3
一种基于深度学习的新闻智能播报系统及方法
语义特征 智能播报方法 语义结构 跨模态融合特征 时间卷积网络
4
一种超大跨度高精度异形结构构建监测方法、设备和介质
建筑骨架 高精度异形 监测方法 模型库 多尺度特征
5
基于不确定性与样本多样性的无人机目标跟踪方法及系统
跟踪器 跟踪方法 视频 序列 预测无人机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号