摘要
本发明涉及自动驾驶测试领域,具体是一种基于大语言模型的自动驾驶全景测试场景生成系统,主要包括:运动编码器,用于采用轻量级神经网络运动编码器将车辆运动参数序列编码为低维潜特征,通过残差连接注入潜在扩散模型的U‑Net网络;全景适配器,用于采用时空解耦的卷积处理场景总体运动条件,在四个分辨率层级上提取并融合多尺度时空特征,得到多模态特征,注入到潜在扩散模型的U‑Net网络之中;多模态标注系统,用于基于大语言模型实现全景图像的标注,生成总结性场景描述。本发明可以实现自动驾驶全景测试场景的高保真生成与多维度验证,有效解决了现有场景生成技术在物理合理性、时空一致性和全景连续性方面的关键问题。
技术关键词
大语言模型
测试场景
生成系统
运动编码器
轻量级神经网络
多模态特征
标注系统
输出全景视频
场景生成技术
适配器
层级
噪声
多尺度
序列
动态物体
系统为您推荐了相关专利信息
图像特征向量
答案生成方法
大语言模型
多模态
分层