摘要
本发明公开了一种基于视觉大模型的运动轨迹构建方法,涉及计算机视觉技术领域,方法包括:采用基于卡尔曼滤波的目标跟踪算法,从原始激光雷达点云与原始视频流中生成平滑的时序同步轨迹;应用结合最小描述长度原则与视觉语言模型语义校验的混合方法,将轨迹分割为一系列在运动学和语义上均完整的候选运动学分段;利用视觉语言模型对这些分段进行初步语义标注,生成初始标注轨迹;对初始标注轨迹进行逻辑一致性精炼,直至收敛为精炼后标注轨迹;将精炼后的轨迹格式化为标准的结构化语义轨迹表征字符串。本发明弥合了低维物理观测与高维驾驶意图之间的语义鸿沟,为下游复杂场景理解与预测任务提供了理想输入。
技术关键词
语义标签
轨迹
视觉
上下文查询
噪声标签
索引
卡尔曼滤波器
分段
多模态
置信度阈值
高清
视频
时序
运动
地图
协方差矩阵
分割方法
系统为您推荐了相关专利信息
质检系统
深度学习处理器
可见光图像
机器人主体
子模块
混凝土布料机
视觉
控制模块
数据处理模块
手势识别算法
无人机防碰撞方法
LoRa无线通信
无人机防碰撞系统
动态协商
避障算法