一种基于多模态感知蒸馏的三维装箱强化学习方法和装置

正文

推荐专利

申请号：CN202510639103

申请日期：2025-05-19

公开号：CN120542637A

公开日期：2025-08-26

类型：发明专利

摘要

一种基于多模态感知蒸馏的三维装箱强化学习方法，包括：构建高保真物理仿真环境，利用教师‑学生双阶段框架实现策略优化：教师网络融合视觉、物品属性及内部物理状态特权信息，通过分级动作掩码和域随机化训练高稳定性装箱策略；学生网络仅依赖视觉输入，通过KL散度与L2损失对齐教师动作分布及价值函数，实现知识蒸馏；部署后结合轻量碰撞检测生成动作掩码。可通过回放机制将失败场景回放至仿真环境，利用教师策略持续优化学生网络。该方法在仿真与现实中均显著提升空间利用率、降低翻倒率，无需昂贵传感器即可适应复杂物理约束，为工业自动化提供高效鲁棒的解决方案。

技术关键词

强化学习方法仿真环境多模态教师策略蒸馏网络学生融合视觉物理装箱系统生成动作噪声参数学习装置计算机程序产品场景注意力机制

系统为您推荐了相关专利信息

基于人形机器人的工厂环境作业系统、人形机器人及方法

人形机器人任务调度装置充电管理模块设备运行状态指令

远程证明方法、装置、介质、电子设备及程序产品

度量虚拟机镜像文件联合文件系统可信执行环境内核

基于远程连接的数据传输方法、装置、设备及介质

云服务器数据传输方法交互控制器车机控制芯片

一种基于多传感器阵列的声源定位和智能追踪方法及系统

多传感器阵列智能追踪方法智能追踪系统多模态传感器远程控制功能

生化污泥在线监测装置及自动上水控制方法

液位传感器抽水泵时间差上水控制方法真空破坏阀

一种基于多模态感知蒸馏的三维装箱强化学习方法和装置

站点导航

APP 下载