摘要
本发明公开了一种基于深度强化学习的卫星板件热控方法,包括:建立卫星板件温度场仿真模型,包括板块以及布设在其上的发热元件、散热元件和温度传感器;构建包含Actor网络和Critic网络的深度强化学习模型,Actor网络用于根据温度传感器的信息生成温度控制策略以控制散热元件的启闭,Critic网络用于评估温度控制策略对温度控制效果的影响;使用策略梯度优化算法在仿真环境中训练深度强化学习模型,得到最优的温度控制策略;将深度强化学习模型应用于实际卫星板件热控系统中,控制散热元件的启闭,实现温度的稳定控制。本方法在仿真环境中使用深度学习强化模型进行卫星板件热控,能够以较少散热资源实现稳定精确的温度控制。
技术关键词
温度控制策略
散热元件
深度强化学习模型
温度传感器
仿真环境
仿真模型
半导体散热器
板块
热扩散方程
发热元件
神经网络架构
热管散热器
板件
动作策略
算法
生成动作
状态更新
系统为您推荐了相关专利信息
覆盖率计算方法
芯片模块
仿真数据
EDA工具
仿真环境
存储芯片
功率芯片
导电电路基板
散热器
导热基板
电流监测器
温度补偿电路
电压补偿电路
信号转换器
电流监测方法
数控加工过程
分析方法
仿真环境
数控系统
分布式传感器网络
深度强化学习模型
卫星网络环境
神经网络权值
决策
策略