基于物体级无损高斯场的多粒度开放词汇查询方法

正文

推荐专利

申请号：CN202510679561

申请日期：2025-05-26

公开号：CN120580432A

公开日期：2025-09-02

类型：发明专利

摘要

本发明提供一种基于物体级无损高斯场的多粒度开放词汇查询方法，引入了一种具有全局一致性代码本的物体级别高斯场，高斯场中的可学习语义标签向量渲染回对应的物体标签后，通过代码本建立起该标签和对应未压缩的高维特征之间的直接映射，从而支持任意维度的语义特征，而无需额外的压缩，显著提高了对物体的理解能力；本发明在多个场景中进行了广泛的定量和定性评估，展示了在物体层面零样本分割和开放词汇理解方面的卓越性能，尤其在物体‑部件的分层检索中实现了最高精度，同时还支持多粒度场景编辑。

技术关键词

查询方法多层感知机三元组感兴趣物体深度图场景图像结构坐标系视觉文本图像编码器像素语义标签瓦片语义特征

系统为您推荐了相关专利信息

一种运动平均方法、系统、电子设备、可读存储介质

顶点相机三元组基准坐标系

一种多级奖励和动作掩码联合优化的机械臂推抓协同方法

协同方法抓取动作仿真环境深度Q学习深度图

基于三元组注意力的多视图三维模型分类方法

三维模型分类方法注意力三元组神经网络模型 Softmax分类器

用于金融数据分析与决策优化的信息论张量回归深度学习模型

深度学习模型金融信息熵数据变量

一种保险场景意图识别方法、装置、电子设备及存储介质

场景意图意图识别模型识别方法词嵌入向量文本

基于物体级无损高斯场的多粒度开放词汇查询方法

站点导航

APP 下载