基于特征增强与语言感知属性引导的视觉定位方法

正文

推荐专利

申请号：CN202510663565

申请日期：2025-05-22

公开号：CN120543834A

公开日期：2025-08-26

类型：发明专利

摘要

本发明属于视觉定位技术领域，涉及一种基于特征增强与语言感知属性引导的视觉定位方法。其核心在于高效整合了特征增强与语言感知属性引导两大关键模块。在特征增强环节，本发明方法通过视觉语义特征的多轮引导，精炼出高区分度的多模态特征，从而极大强化目标对象的特征显著性，确保其与背景及其他非目标对象特征清晰可辨。在语言感知属性引导方面，本发明方法深度挖掘文本嵌入与视觉表征间的深层语义耦合，精准捕获与目标对象高度相关的核心属性信息，并以此优化初始化目标查询，为后续的精准定位奠定坚实基础。

技术关键词

视觉定位方法语义特征模态特征对象跨模态阶段多头注意力机制文本融合视觉特征视觉定位技术编码器视觉特征提取查询特征多层感知机标记度函数

系统为您推荐了相关专利信息

一种基于多模态大模型的接触网隐蔽性缺陷智能检测方法

缺陷智能检测方法多模态图像色彩归一化结构声音轨道交通供电系统

一种基于多模态深度感知与时序预测的浮选泡沫动态诊断及自适应调控系统

浮选泡沫多模态深度深度强化学习关键工艺参数深度特征提取

一种基于深度学习的加密恶意流量检测方法

网络流量数据 DBSCAN算法加密恶意流量神经网络模型样本

一种基于智能化工程管理系统的远程监控与控制方法

智能化工程李雅普诺夫指数动态权重分配管理系统生成控制指令

电力标准构建方法及设备

关键词数据存储三维模型对象生成电力

基于特征增强与语言感知属性引导的视觉定位方法

站点导航

APP 下载