摘要
本发明公开一种基于大语言模型自动驾驶系统的模型蒸馏方法及系统,属于人工智能技术领域。所述方法包括:构建离线数据集DLLM;基于所述离线数据集,生成鲁棒性正则化处理的蒸馏策略;固定所述蒸馏策略,并通过与在线环境的交互来微调联合策略,以生成训练后的联合策略;其中,所述联合策略包括:适配器策略和所述蒸馏策略。本发明可以确保在各种驾驶场景中的适应性和鲁棒性。
技术关键词
模型蒸馏方法
策略
自动驾驶系统
大语言模型
计算机程序指令
离线
鲁棒性
数据
适配器
对抗性
参数
可读存储介质
蒸馏系统
人工智能技术
生成动作
路由器
解码器
决策
电子设备
系统为您推荐了相关专利信息
历史交互信息
交互方法
意图识别
策略
人机交互技术
水库
无模型自适应控制
水文
数据存储模块
智能调度系统
智能护眼
照明控制系统
马尔可夫模型
环境光照强度
数据