用于自动驾驶的视觉语言模型的推理方法、装置和设备

AITNT
正文
推荐专利
用于自动驾驶的视觉语言模型的推理方法、装置和设备
申请号:CN202510472943
申请日期:2025-04-16
公开号:CN120409671A
公开日期:2025-08-01
类型:发明专利
摘要
本公开属于自动驾驶技术领域,具体涉及一种用于自动驾驶的视觉语言模型的推理方法、装置和设备。其中所述方法包括:在所述视觉语言模型中获取对应于目标时刻前一时刻的记忆的令牌组合及其中每个令牌的概率;如果所有所述令牌的概率都大于预设阈值,则将前一时刻的记忆作为目标时刻的记忆,如果存在低于预设阈值的所述令牌,则将所述令牌组合分割为逻辑单元,对每个所述逻辑单元检查是否存在低于预设阈值的所述令牌,如果存在,则刷新所述逻辑单元,将刷新后的前一时刻的记忆作为目标时刻的记忆;基于目标时刻的多视角图像流和记忆,利用所述视觉语言模型生成用于确定自动驾驶轨迹的推理状态和元动作。
技术关键词
令牌 记忆 自动驾驶系统 推理方法 视觉 逻辑 注意力 自动驾驶技术 视角 推理装置 存储计算机程序 轨迹 图像 存储器 处理器 模块 离线 数据
系统为您推荐了相关专利信息
1
一种铁路货运的货物智能装卸方法
智能行走平台 装卸方法 输送线 低重心脚轮 管理信息系统
2
一种带有机械式破拱装置的圆形料仓
圆形料仓 折叠机械臂 旋转系统 工作件 通风管道
3
一种卷积神经网络结构的卷积核整型剪枝方法及系统
卷积神经网络结构 剪枝方法 掩码策略 剪枝模型 动态规划算法
4
一种低温变频空气源热泵的除霜控制方法、系统和计算机软件
变频空气源热泵 能量回收装置 除霜系统 训练预测模型 回收压缩机
5
基于PLC的冶金钢坯自动化捞取控制系统
钢坯 三维视觉传感器 传感器融合 扭矩传感器单元 控制系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号