摘要
本发明涉及一种基于强化学习与对比学习的发酵过程优化调控方法。该方法包括:获取青霉素发酵过程的历史批次数据及待调控批次数据,采用深度强化学习双行动者网络,构建优化调控模型;结合对比学习的损失函数优化动作价值函数,增强状态间相似性与差异性的辨识能力,将历史批次数据输入模型进行训练,计算青霉素产量与期望产量之间的差值,采用反向传播算法更新参数,并通过贝叶斯优化自动调整超参数;最后,将待调控批次的数据输入到已训练好的神经网络调控模型中,通过迭代动作输出实现青霉素产量调控。采用本方法能够有效调控青霉素产量,为青霉素发酵过程的优化调控提供了有力的技术支持与理论指导。
技术关键词
优化调控方法
样本
损失函数优化
传播算法
深度强化学习
模型超参数
优化调控模型
累积分布函数
网络结构
数据
概率密度函数
代表
神经网络模型
调控策略
噪声