一种序贯决策强化学习训练方法及其系统

正文

推荐专利

一种序贯决策强化学习训练方法及其系统

申请号：CN202510145426

申请日期：2025-02-10

公开号：CN120354964A

公开日期：2025-07-22

类型：发明专利

摘要

本发明涉及序贯决策强化学习训练技术领域，具体为一种序贯决策强化学习训练方法及其系统，包括序贯决策强化学习训练方法和用于实现序贯决策实验训练方法的训练系统，所述序贯决策实验方法包括初始状态、行为选择和奖励等步骤；所述序贯决策实验训练系统包括行为训练箱、实验参数设置模块与实验状态监测模块、多通道神经数据检测与记录系统，所述行为训练箱、实验参数设置与实验状态监测模块、多通道神经数据检测与记录系统之间通信由包括STM32单片机为核心的微控制器以及其外围电路实现。

技术关键词

学习训练方法状态监测模块动作检测装置状态显示装置决策 STM32单片机微控制器视频监控装置训练系统学习训练技术多通道标记人机交互界面按键亚克力板三角形箱体内壁箱体底部蓝色

系统为您推荐了相关专利信息

用于多模态决策模型的输入重排与缓存复用方法

文本注意力序列图像复用方法

一种土地利用效率的测算方法、装置和设备

字段数据获取单元数据获取模块指标登记频率

一种面向工业生产的安全事件的生成式对抗推演方法

数字孪生模型推演方法数据一致性验证工业生产物理

一种基于过程优化和知识决策的大型分段装配仿真方法

装配仿真方法分段仿真平台散货船决策树算法

一种基于生成式大模型的网络安全辅助分析决策方法

分析决策方法智能关联分析网络安全数据防火墙日志生成决策建议

一种序贯决策强化学习训练方法及其系统

站点导航

APP 下载