摘要
本申请涉及一种冰箱及其模型训练方法。该冰箱包括箱体、制冷系统、温度传感器和控制器,被配置为:获取控制参数集合;针对每一迭代过程,确定随机概率,并根据本次迭代次序,确定选择概率阈值;在本次迭代过程下的随机概率不小于本次迭代过程下的选择概率阈值的情况下,将运行环境数据输入至待训练的强化学习模型中,得到预测控制参数;在本次迭代过程下的随机概率小于本次迭代过程下的选择概率阈值的情况下,从控制参数集合中随机选取冰箱控制参数,作为预测控制参数;根据预测控制参数,控制冰箱制冷运行,并获取冰箱运行评估数据;根据运行环境数据、预测控制参数和运行评估数据,构建强化学习模型的训练数据。该方法能够降低模型训练成本。
技术关键词
强化学习模型
模型训练方法
数据
冰箱制冷
控制器
温度传感器
制冷系统
控制冰箱
指数
冷藏室
制冷剂
箱体
跨度