摘要
本发明提供一种轨道场景预测方法、装置、设备及介质,涉及轨道感知技术领域,轨道场景预测方法包括:获取轨道场景中当前帧对应的RGB图像、RGB图像对应的深度图、RGB图像对应的法线图、RGB图像对应的文本提示和生成任务指令;将RGB图像以及对应的深度图、法线图、文本提示和生成任务指令输入轻量化扩散模型,得到轻量化扩散模型输出的生成任务指令对应的轨道场景预测视频;轻量化扩散模型是基于关键时间步的各样本图像对应的样本深度图、样本法线图、样本文本提示对初始轻量化扩散模型训练得到的。本发明通过使用关键时间步的多模态数据训练的轻量化扩散模型减少了模型的计算参数,加速了模型的预测速度和准确性。
技术关键词
场景预测方法
深度图
样本
视频
轨道
图像
文本
编码模块
解码模块
指令
非暂态计算机可读存储介质
大语言模型
多模态
轨迹
处理器
预测装置
存储器
电子设备
系统为您推荐了相关专利信息
操作控制方法
待认证
识别监控视频
计算机程序产品
操作控制装置
缺陷分类方法
客户端
多头注意力机制
数据
工业缺陷分类技术
人体动作识别方法
交叉注意力机制
原型
样本
动作识别模型