一种序贯决策强化学习训练方法及其系统

AITNT
正文
推荐专利
一种序贯决策强化学习训练方法及其系统
申请号:CN202510145426
申请日期:2025-02-10
公开号:CN120354964A
公开日期:2025-07-22
类型:发明专利
摘要
本发明涉及序贯决策强化学习训练技术领域,具体为一种序贯决策强化学习训练方法及其系统,包括序贯决策强化学习训练方法和用于实现序贯决策实验训练方法的训练系统,所述序贯决策实验方法包括初始状态、行为选择和奖励等步骤;所述序贯决策实验训练系统包括行为训练箱、实验参数设置模块与实验状态监测模块、多通道神经数据检测与记录系统,所述行为训练箱、实验参数设置与实验状态监测模块、多通道神经数据检测与记录系统之间通信由包括STM32单片机为核心的微控制器以及其外围电路实现。
技术关键词
学习训练方法 状态监测模块 动作检测装置 状态显示装置 决策 STM32单片机 微控制器 视频监控装置 训练系统 学习训练技术 多通道 标记 人机交互界面 按键 亚克力板 三角形 箱体内壁 箱体底部 蓝色
系统为您推荐了相关专利信息
1
用于多模态决策模型的输入重排与缓存复用方法
文本 注意力 序列 图像 复用方法
2
一种土地利用效率的测算方法、装置和设备
字段 数据获取单元 数据获取模块 指标 登记频率
3
一种面向工业生产的安全事件的生成式对抗推演方法
数字孪生模型 推演方法 数据一致性验证 工业生产 物理
4
一种基于过程优化和知识决策的大型分段装配仿真方法
装配仿真方法 分段 仿真平台 散货船 决策树算法
5
一种基于生成式大模型的网络安全辅助分析决策方法
分析决策方法 智能关联分析 网络安全数据 防火墙日志 生成决策建议
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号