摘要
本发明公开了一种基于知识蒸馏和多智能体强化学习的智能控制方法,包括以下步骤:通过环境监控智能体对传感器设备获取的环境参数进行图结构化编码建模;通过决策与协调智能体基于环境监控智能体的输出,使用因果关系模型对各类环境变量进行分析,挖掘环境变化与设备控制之间的因果关系;基于多智能体强化学习的方法,提升决策与协调智能体的自主决策能力与协同控制;基于分布式原型知识蒸馏,提升决策与协调智能体在边缘设备上的学习与推理能力;本方法具有在动态环境中提高响应速度、逐步提升整体控制性能和精度,从而实现自适应调整,优化设备运行并减少能耗的特点。
技术关键词
智能控制方法
表达式
决策
环境生成设备
多智能体强化学习
因果关系模型
注意力机制
序列化特征
蒸馏
设备控制
原型
传感器设备
设备动作控制
均值聚类算法
双曲正切函数
坐标
强化学习算法
数学
参数
多层感知机