摘要
本发明涉及一种基于强化学习的磁导丝控制方法、系统及仿真系统,所述方法包括:建模为马尔可夫决策过程,所述马尔可夫决策过程包括状态集合、动作集合和奖励函数,所述状态集合指外部磁体和磁导丝的运行状态,所述动作集合指外部磁体和磁导丝的可执行操作,所述奖励函数用于评估磁导丝运动的优劣;在所述马尔可夫决策过程确定的框架内,采用深度确定性策略梯度算法对智能体进行训练,所述状态集合为智能体的输入,所述动作集合为智能体的输出,所述奖励函数为智能体的评价标准,得到最优策略;基于所述最优策略控制所述磁场和导丝推送模块,进而控制所述磁导丝。本发明通过上述设置,无需精确建模即可在复杂场景中实现磁导丝的精准控制。
技术关键词
磁体
网络
策略
生成可调
血管模型
控制仿真系统
决策
回放技术
导丝
轨迹误差
磁场环境
机制
控制模块
噪声
算法
运动
参数
系统为您推荐了相关专利信息
数据采集模板
节点地理位置
医院
联邦学习方法
闭环方法
风电机组设备
故障预测方法
异常设备
DBSCAN算法
设备监控装置
无人潜航器
编队协同控制方法
协同运动控制
仿真环境
编队系统
年龄判断方法
面部
数据采集模块
判断系统
身份证信息采集