摘要
本发明涉及序贯决策强化学习训练技术领域,具体为一种序贯决策强化学习训练方法及其系统,包括序贯决策强化学习训练方法和用于实现序贯决策实验训练方法的训练系统,所述序贯决策实验方法包括初始状态、行为选择和奖励等步骤;所述序贯决策实验训练系统包括行为训练箱、实验参数设置模块与实验状态监测模块、多通道神经数据检测与记录系统,所述行为训练箱、实验参数设置与实验状态监测模块、多通道神经数据检测与记录系统之间通信由包括STM32单片机为核心的微控制器以及其外围电路实现。
技术关键词
学习训练方法
状态监测模块
动作检测装置
状态显示装置
决策
STM32单片机
微控制器
视频监控装置
训练系统
学习训练技术
多通道
标记
人机交互界面
按键
亚克力板
三角形
箱体内壁
箱体底部
蓝色
系统为您推荐了相关专利信息
数字孪生模型
推演方法
数据一致性验证
工业生产
物理
分析决策方法
智能关联分析
网络安全数据
防火墙日志
生成决策建议