基于视觉语言模型的自动驾驶行为决策系统及方法

正文

推荐专利

申请号：CN202510615433

申请日期：2025-05-14

公开号：CN120123997A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种基于视觉语言模型的自动驾驶行为决策系统及方法，所述系统包括：数据处理模块用于采用视觉语言模型提取多元深层语义信息；奖励生成模块用于生成对比语义目标奖励；奖励合成模块用于融合计算细粒度综合奖励；训练管理模块用于采用重放缓冲技术存储实时状态数据，采用批量处理机制进行细粒度综合奖励统一计算，基于最大熵强化学习算法进行自动驾驶策略训练；决策控制模块用于将训练后策略网络部署于车辆，根据网络输出进行车辆控制；本发明能够通过预训练视觉语言模型自动生成语义奖励信号，结合车辆状态信息进行层次化奖励合成，引入批量处理机制优化计算流程，最终显著提升自动驾驶系统的安全性、鲁棒性和泛化能力。

技术关键词

决策系统车辆状态数据语义视觉特征网络更新过程强化学习算法数据处理模块决策控制模块缓冲技术策略网络部署车辆自动驾驶系统批量因子语言编码器图像增强

系统为您推荐了相关专利信息

基于Deepseek的资源加载方法和系统

深度强化学习模型网络带宽波动场景资源加载方法语义关联度

一种基于类型感知聚合的多跳推理方法及系统

实体表达式三元组关系注意力

一种基于跨模态对齐的用户画像构建方法、系统及设备

画像构建方法跨模态兴趣画像知识图谱数据文本特征向量

基于多尺度空间注意力机制的单幅建筑图像反射伪影消除方法及系统

伪影消除方法感知损失函数注意力机制建筑组合式

一种通用机器人灵巧手抓取示教装置及抓取策略学习方法

机器人灵巧手策略学习方法交叉注意力机制示教装置计算机程序产品

基于视觉语言模型的自动驾驶行为决策系统及方法

站点导航

APP 下载