用于自主驾驶的视觉语言规划（VLP）基础模型的系统和方法

正文

推荐专利

申请号：CN202411589987

申请日期：2024-11-08

公开号：CN119992486A

公开日期：2025-05-13

类型：发明专利

摘要

提供了用于自主驾驶的视觉语言规划(VLP)基础模型的系统和方法。用于使用视觉语言规划(VLP)模型训练自主驾驶系统的方法和系统。图像数据从安装于载具的相机获得，涵盖关于位于外部环境内的行为者的细节。经由图像处理，该系统标识环境内的这些行为者。然后生成周围环境的鸟瞰图(BEV)表示，其封装了与载具和所识别的行为者相关联的时空信息。VLP机器学习模型的执行开始于从BEV中提取基于视觉的规划特征，并接收或生成表征环境内载具的各种属性的文本信息。从该文本信息中提取基于文本的规划特征。为了增强模型性能，对比学习模型被用于建立基于视觉和基于文本的规划特征之间的相似性，并且基于相似性输出预测轨迹。

技术关键词

规划自主驾驶系统视觉文本编码器图像编码器轨迹机器学习模型训练数据自行车图像处理处理器相机异性模板指令存储器基础

系统为您推荐了相关专利信息

一种新能源汽车长途出行的充电规划方法与系统

充电规划方法平均行驶里程行驶里程数据充电站信息车况数据

一种基于环境地图构建的摄影路径规划方法及系统

路径规划方法采样点地图拉普拉斯金字塔因子

电力巡检路径规划方法、装置、电子设备及存储介质

电力巡检路径规划方法算法障碍物非暂态计算机可读存储介质

数据闭环系统、数据闭环方法、控制器及可读存储介质

数据处理模块闭环方法云端工作流清洗单元

基于四叉树的端到端组密钥协商方法及装置

密钥协商方法状态更新四叉树结构群组通信更新消息

用于自主驾驶的视觉语言规划（VLP）基础模型的系统和方法

站点导航

APP 下载