摘要
本发明属于伺服控制优化相关技术领域,其公开了一种基于柔性动作‑评价算法的滚珠丝杠进给系统伺服参数优化方法及设备,该方法包括以下步骤:(1)构建基于Actor‑Critic框架的SAC算法的智能体网络,所述智能体网络引入了最大熵;(2)通过环境搜索接口将滚珠丝杠进给系统的仿真模型和SAC算法的智能体网络关联,并训练SAC算法的智能体网络,继而采用训练完成的智能体网络获得优化的伺服参数。使用的SAC算法引入了最大熵概念,在探索最大累计奖励值的同时,探索随机策略的最大熵,拓宽了智能体网络的探索空间,提高探索的随机性,相较于启发式算法和其他深度强化学习算法而言,不易陷入局部最优。
技术关键词
滚珠丝杠进给系统
伺服参数优化方法
评价算法
SAC算法
网络
柔性
伺服控制优化
深度强化学习算法
参数优化系统
仿真模型
启发式算法
可读存储介质
曲线
策略更新
处理器
速度
指令
系统为您推荐了相关专利信息
学习训练方法
记忆
深度强化学习算法
末端执行器
阶段
新能源车充电口
深度学习识别模型
充电口位置
结构光
定位方法
协议特征
网络设备
识别方法
词嵌入向量
深度神经网络
生存预测系统
多模态特征
融合特征
ResNet网络
生存预测方法