摘要
本发明提出一种基于分层策略学习的冰壶机器人动态投掷方法及系统。所述系统通过轨迹策略生成模块与自适应控制模块的信息融合,实现了从环境状态感知到动作控制的闭环结构。目标位置与轨迹参数由上层模块生成,冰面参数由状态估计模块提取,统一输入控制模块生成控制指令。该机制提升了控制系统的环境适应性、鲁棒性与可扩展性,适用于冰壶类任务及其他自主轨迹控制应用。
技术关键词
冰壶机器人
冰面
阶段
分层策略
深度强化学习方法
投掷方法
生成控制指令
子模块
动作控制模块
冰壶比赛
引导机器人
轨迹结构
概率密度函数
预测误差
网络
策略性