一种面向连续动作任务的光电混合强化学习控制方法

正文

推荐专利

申请号：CN202510260448

申请日期：2025-03-06

公开号：CN120106162A

公开日期：2025-06-06

类型：发明专利

摘要

本发明公开了一种面向连续动作任务的光电混合强化学习控制方法，涉及光计算、控制工程技术领域。该方法包括：利用智能体状态信息与历史隐藏序列产生输入光场；通过由相干滤波系统构成的光学神经网络对输入光场进行全局特征混合，并实现光电转换与归一化处理，生成包含当前状态的历史隐藏序列；利用全连接层处理上述序列，生成控制智能体的连续动作；价值网络对策略网络的动作给出评价，得到策略梯度，同时计算时间差分目标优化价值网络参数；将策略梯度编码并在光场中前向传播，于光学神经网络共轭面获取梯度光场，从而更新光学神经网络参数；训练结束后仅保留光学神经网络与少量电子计算，即可实现智能体的连续动作任务控制。通过上述设计，本发明有效解决了现有光学神经网络在与环境交互任务中难以适应连续动作空间控制的问题，显著提升了控制能力和计算效率。

技术关键词

强化学习控制方法神经网络参数数字微镜器件电荷耦合器件光电滤波系统透镜控制工程技术连续动作空间序列优化控制策略控制智能体空间光调制器矩阵梯度方法非线性电子

系统为您推荐了相关专利信息

一种用于运输石墨舟物料的AGV装置及其方法

石墨舟测距传感器车体反射式光电传感器定位传感器

一种支持多调光模式的调光驱动电源

调光单元控制器单元直流电压调光调光驱动电源信号转换接口

一种三维激光雷达点云采集控制方法和系统

三维激光雷达点云采集控制方法生成高密度脉冲材料屈服强度

一种基于LED光源的干散货仓检测车定位方法、系统及终端

检测车 LED光源定位方法 LED定位光电二极管

光谱芯片

滤光微透镜波长芯片光调制层

一种面向连续动作任务的光电混合强化学习控制方法

站点导航

APP 下载