基于3D时空感知与类人决策推理的自动驾驶大模型框架

正文

推荐专利

申请号：CN202510645388

申请日期：2025-05-20

公开号：CN120182938A

公开日期：2025-06-20

类型：发明专利

摘要

本发明适用于自动驾驶技术领域，提供了基于3D时空感知与类人决策推理的自动驾驶大模型框架，通过跨模态动态语义补丁嵌入与多尺度链式推理的深度集成，有效提升了自动驾驶系统在复杂场景下的三维时空语义推理能力，实现了全视角场景视频流与全局鸟瞰图的高效协同处理；同时，通过基于规则驱动与语义动作交互的多层次时空语义自适应数据提取范式和语义化动作表征生成，结合跨模态任务导向的多级训练矩阵架构，模型在场景理解、决策透明性和端到端驾驶任务优化方面表现出色。有效提升了系统在动态行为推演的准确率，提高了决策可解释性，为自动驾驶的全局路径规划和类人决策提供了强有力的技术支持。

技术关键词

场景决策跨模态文本编码器联合损失函数视觉交通动作交互补丁动态层次化语义生成自然语言解码器语义地图多模态自动驾驶系统数据视频流

系统为您推荐了相关专利信息

用于人体重识别模型的模型训练方法、系统及电子设备

人体重识别特征提取模块加权特征标识标签模型训练方法

一种基于决策规则的养殖塘堤坝遥感提取方法

分类特征养殖塘决策遥感影像数据堤坝

一种可旋转、变径爬树机器人

爬树机器人麦克纳姆轮自动化控制系统机械臂机器人主体框架

一种人脸多姿态生成方法、系统、电子设备及存储介质

关键点人脸姿态编辑文本编码器图像编码器

一种机巢故障下的多无人机巡检任务重规划方法

巡检无人机邻域搜索算法巡检路径重规划方法多无人机

基于3D时空感知与类人决策推理的自动驾驶大模型框架

站点导航

APP 下载