基于视觉标记的自动驾驶空间规划增强方法

正文

推荐专利

基于视觉标记的自动驾驶空间规划增强方法

申请号：CN202510359692

申请日期：2025-03-25

公开号：CN120298992A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了一种基于视觉标记的自动驾驶空间规划增强方法，包括以下步骤：获取原始图像和文本输入；对原始图像进行处理，获得图像特征；对文本输入进行处理，获得文本特征；利用图像特征和文本特征生成带有视觉标记的文本输出；对带有视觉标记的文本输出进行转换，获得带坐标的文本输出；显著提升了自动驾驶场景中空间理解的准确性和语义一致性，实现了视觉感知与语义表达的高度同步，有效解决了现有方法视觉与语言模态语义割裂的问题。不仅大幅提高了自动驾驶问答任务中对物体位置、运动状态及交互关系的解析精度，还能显著增强复杂驾驶场景下的决策可靠性和规划自然度。

技术关键词

视觉文本标记掩膜对象坐标生成场景生成图像特征大语言模型语义副本索引交通半透明参数编码器表达式

系统为您推荐了相关专利信息

基于大语言模型的问答方法、装置、设备和存储介质

文本大语言模型意图类别答案意图识别

一种基于出声思考驱动检索增强的元认知水平预测方法

水平预测方法信息抽取方法多智能体系统线性回归模型校正

多决策者协同决策方法、装置及应用

决策方法人工智能模型人机协同技术标签序列

一种基于行车记录仪的行驶智能监控方法及系统

智能监控系统深度学习模型驾驶员疲劳状态智能监控方法车辆行驶数据

文档召回方法、装置、电子设备和存储介质

召回方法电子设备计算机程序产品处理器可读存储介质

基于视觉标记的自动驾驶空间规划增强方法

站点导航

APP 下载