基于分级瀑布式动作掩码的在线三维装箱强化学习实时决策方法及系统

AITNT
正文
推荐专利
基于分级瀑布式动作掩码的在线三维装箱强化学习实时决策方法及系统
申请号:CN202510639152
申请日期:2025-05-19
公开号:CN120542638A
公开日期:2025-08-26
类型:发明专利
摘要
一种基于分级瀑布式动作掩码的在线三维装箱强化学习实时决策方法及系统,通过多级过滤机制高效筛选离散动作空间。基于容器高度信息和已放置物体投影轮廓,依次执行几何高度裁剪与距离场阈值剔除,快速去除无效动作;并行包围盒碰撞检测进一步压缩候选动作规模;通过短时物理仿真验证动作的物理稳定性,生成可靠的动作掩码。结合强化学习策略网络,仅对有效动作进行概率归一化采样,输出最优放置决策。该方法通过四级分层筛选将数十万动作缩减至百级别,结合GPU加速实现毫秒级实时响应,显著降低翻倒率并提升空间利用率,同时支持域随机化训练增强环境适应性,可扩展至可变箱体与复杂物品场景,满足自动分拣、仓储物流等工业场景的高效稳定需求。
技术关键词
决策方法 强化学习策略 在线 堆叠高度 物理 碰撞检测模块 容器 GPU并行 物体 决策系统 计算机程序产品 状态更新 可读存储介质 网络 轮廓 鲁棒性 机制
系统为您推荐了相关专利信息
1
一种面向数字孪生的工业大语言模型语料制作方法
大语言模型 数字孪生系统 文本 虚拟设备 分块
2
计算机辅助下的IGBT参数全局优化方法及系统
全局优化方法 参数 粒子 主成分分析算法 非线性
3
参数化电容的提取方法、装置、设备及存储介质
参数 训练样本数据 版图 电容结构 寄生电容值
4
一种基于人机协作的远程智能装配平台及其操作方法
智能装配平台 人机协作 装配机械臂 转运系统 手柄控制系统
5
一种电力大数据的跨领域特征的分析与识别方法
个性化特征 电力 Apriori算法 负荷曲线特征 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号