基于分级瀑布式动作掩码的在线三维装箱强化学习实时决策方法及系统

正文

推荐专利

申请号：CN202510639152

申请日期：2025-05-19

公开号：CN120542638A

公开日期：2025-08-26

类型：发明专利

摘要

一种基于分级瀑布式动作掩码的在线三维装箱强化学习实时决策方法及系统，通过多级过滤机制高效筛选离散动作空间。基于容器高度信息和已放置物体投影轮廓，依次执行几何高度裁剪与距离场阈值剔除，快速去除无效动作；并行包围盒碰撞检测进一步压缩候选动作规模；通过短时物理仿真验证动作的物理稳定性，生成可靠的动作掩码。结合强化学习策略网络，仅对有效动作进行概率归一化采样，输出最优放置决策。该方法通过四级分层筛选将数十万动作缩减至百级别，结合GPU加速实现毫秒级实时响应，显著降低翻倒率并提升空间利用率，同时支持域随机化训练增强环境适应性，可扩展至可变箱体与复杂物品场景，满足自动分拣、仓储物流等工业场景的高效稳定需求。

技术关键词

决策方法强化学习策略在线堆叠高度物理碰撞检测模块容器 GPU并行物体决策系统计算机程序产品状态更新可读存储介质网络轮廓鲁棒性机制

系统为您推荐了相关专利信息

一种面向数字孪生的工业大语言模型语料制作方法

大语言模型数字孪生系统文本虚拟设备分块

计算机辅助下的IGBT参数全局优化方法及系统

全局优化方法参数粒子主成分分析算法非线性

参数化电容的提取方法、装置、设备及存储介质

参数训练样本数据版图电容结构寄生电容值

一种基于人机协作的远程智能装配平台及其操作方法

智能装配平台人机协作装配机械臂转运系统手柄控制系统

一种电力大数据的跨领域特征的分析与识别方法

个性化特征电力 Apriori算法负荷曲线特征样本

基于分级瀑布式动作掩码的在线三维装箱强化学习实时决策方法及系统

站点导航

APP 下载