一种基于视觉大模型的运动轨迹构建方法

正文

推荐专利

一种基于视觉大模型的运动轨迹构建方法

申请号：CN202511135136

申请日期：2025-08-14

公开号：CN120635153B

公开日期：2025-12-12

类型：发明专利

摘要

本发明公开了一种基于视觉大模型的运动轨迹构建方法，涉及计算机视觉技术领域，方法包括：采用基于卡尔曼滤波的目标跟踪算法，从原始激光雷达点云与原始视频流中生成平滑的时序同步轨迹；应用结合最小描述长度原则与视觉语言模型语义校验的混合方法，将轨迹分割为一系列在运动学和语义上均完整的候选运动学分段；利用视觉语言模型对这些分段进行初步语义标注，生成初始标注轨迹；对初始标注轨迹进行逻辑一致性精炼，直至收敛为精炼后标注轨迹；将精炼后的轨迹格式化为标准的结构化语义轨迹表征字符串。本发明弥合了低维物理观测与高维驾驶意图之间的语义鸿沟，为下游复杂场景理解与预测任务提供了理想输入。

技术关键词

语义标签轨迹视觉上下文查询噪声标签索引卡尔曼滤波器分段多模态置信度阈值高清视频时序运动地图协方差矩阵分割方法

系统为您推荐了相关专利信息

基于AI视觉质检系统的机器人

质检系统深度学习处理器可见光图像机器人主体子模块

一种多区域的地图构建方法及装置

移动机器人遥控设备地图构建方法多区域指令

基于深度视觉控制的混凝土布料机

混凝土布料机视觉控制模块数据处理模块手势识别算法

基于LoRa通信的无人机防碰撞方法及其系统

无人机防碰撞方法 LoRa无线通信无人机防碰撞系统动态协商避障算法

用于少样本缺陷图像生成的扩散模型微调方法和装置

微调方法缺陷类别分支图像生成模型样本

一种基于视觉大模型的运动轨迹构建方法

站点导航

APP 下载