摘要
本申请涉及一种自动驾驶控制方法和感知控制系统,所述方法包括:获取拍摄装置采集的当前时刻的目标图像信息;将所述目标图像信息输入目标多模态大型语言模型,得到所述目标多模态大型语言模型输出的驾驶员的操作行为信息;将所述目标图像信息和所述操作行为信息输入目标视频扩散模型,得到所述目标视频扩散模型输出的下一时刻的预测图像信息,以通过所述预测图像信息确定自动驾驶策略。本申请增强自动驾驶策略的鲁棒性。
技术关键词
图像编码器
文本特征向量
图像特征向量
文本编码器
多模态
多层感知器
驾驶控制方法
感知控制系统
样本
图像特征提取
拍摄装置
视频
输入输出模块
计算机可执行指令
参数
策略
驾驶控制装置
控制模块
输出端
系统为您推荐了相关专利信息
工业物联网
工业现场设备
神经网络结构
YOLO模型
识别缺陷
多源遥感数据
古树名木
识别方法
合成孔径雷达数据
随机森林
文本编码器
图像编码器
样本
图像检测方法
聊天软件