摘要
本发明提供一种基于深度强化学习的连续微流控生物芯片多环节联合优化设计方法,包括:构建状态空间,通过图卷积神经网络提取节点拓扑关系及连通性特征;定义三维动作空间;基于所述状态空间和动作空间的动态更新,同步生成操作设备绑定方案、结合优先级的调度序列、以及基于路径规划算法的布局布线方案;计算多目标奖励函数,所述奖励函数包含布局合法性奖励与归一化加权的生化反应时间、流道总长度及阀门数量奖励,其中布局合法性奖励根据芯片网格坐标点的设备占用数量确定;采用近端策略优化算法,通过策略梯度更新机制最大化所述多目标奖励函数,实现绑定、调度、布局和布线的联合优化,输出芯片流层架构方案。
技术关键词
联合优化设计方法
微流控生物芯片
深度强化学习
路径规划算法
卷积神经网络提取
布局
节点特征
动态更新
实时状态信息
布线
更新网络参数
坐标点
绑定设备
列表
策略更新
调度算法
系统为您推荐了相关专利信息
深度强化学习
策略
充电站
计算机可执行指令
城市电网系统
分布式边缘计算方法
分布式云
深度Q学习
卸载系统
深度强化学习
路径规划算法
平板运输车
障碍物
四轮独立转向
轨迹