基于视觉语言的自动驾驶方法、设备及介质

正文

推荐专利

基于视觉语言的自动驾驶方法、设备及介质

申请号：CN202510600345

申请日期：2025-05-09

公开号：CN120397003A

公开日期：2025-08-01

类型：发明专利

摘要

本申请提供一种基于视觉语言的自动驾驶方法、设备及介质，涉及自动驾驶技术领域。该方法包括：获取导航地图输入的导航指令以及多视角传感器采集到的多视图图像数据；根据预设的轨迹规划模型中的视觉语言模型以及导航指令和多视图图像数据，得到视觉语言向量；根据轨迹规划模型中的端到端模型、导航指令、多视图图像数据以及视觉语言向量，得到车辆的规划轨迹；确定规划轨迹对应的控制信号，并根据控制信号进行自动驾驶。本申请的方法，简化了自动驾驶过程中轨迹预测的处理流程，降低了计算量消耗，且能处理复杂的路况，提高了自动驾驶的场景覆盖度。

技术关键词

自动驾驶方法视觉计算机执行指令令牌轨迹规划图像文本特征向量数据文本编码器场景标签多视角神经网络模型样本自动驾驶技术可读存储介质车辆

系统为您推荐了相关专利信息

异常信息处理方法、装置、设备、介质和产品

异常信息建立通信命令信息处理方法计算机执行指令

一种智能卡版面生成方法、装置、存储介质及计算机设备

版面生成方法文本大语言模型主题关键词计算机可读指令

基于大模型的中文网页国际化适配方法、装置及介质

国际化资源文件网页架构中文文本自然语言模型多媒体

基于知识图谱的眼科超声报告生成方法及系统

报告生成方法视觉注意力机制节点特征眼科图像

一种钢筋库存变化检测方法、电子设备及存储介质

变化检测方法钢筋相机运动估计实时视频流变化检测模型

基于视觉语言的自动驾驶方法、设备及介质

站点导航

APP 下载