摘要
本公开属于自动驾驶技术领域,具体涉及一种用于自动驾驶的视觉语言模型的推理方法、装置和设备。其中所述方法包括:在所述视觉语言模型中获取对应于目标时刻前一时刻的记忆的令牌组合及其中每个令牌的概率;如果所有所述令牌的概率都大于预设阈值,则将前一时刻的记忆作为目标时刻的记忆,如果存在低于预设阈值的所述令牌,则将所述令牌组合分割为逻辑单元,对每个所述逻辑单元检查是否存在低于预设阈值的所述令牌,如果存在,则刷新所述逻辑单元,将刷新后的前一时刻的记忆作为目标时刻的记忆;基于目标时刻的多视角图像流和记忆,利用所述视觉语言模型生成用于确定自动驾驶轨迹的推理状态和元动作。
技术关键词
令牌
记忆
自动驾驶系统
推理方法
视觉
逻辑
注意力
自动驾驶技术
视角
推理装置
存储计算机程序
轨迹
图像
存储器
处理器
模块
离线
数据
系统为您推荐了相关专利信息
智能行走平台
装卸方法
输送线
低重心脚轮
管理信息系统
卷积神经网络结构
剪枝方法
掩码策略
剪枝模型
动态规划算法
变频空气源热泵
能量回收装置
除霜系统
训练预测模型
回收压缩机
钢坯
三维视觉传感器
传感器融合
扭矩传感器单元
控制系统