摘要
本发明涉及一种基于鲁棒联邦知识追踪激励分配的学习成绩预测方法和介质,方法包括以下步骤:学校作为参与者,进行联邦知识追踪训练;根据参与者的训练时延,使用贪心算法制定带宽分配决策,使所有参与者同步完成模型更新与上传,各个参与者并行执行联邦知识追踪训练;联邦知识追踪训练完成后,评估各个参与者对全局知识追踪模型的贡献水平,使用强化学习方法生成激励分配策略,计算该激励分配策略下所有参与者的反馈效用总奖励,更新学习网络,最终选择反馈效用总奖励最高的激励分配策略,使用全局知识追踪模型预测各个学校在该课程的各学生未来答题准确率。与现有技术相比,本发明具有整体效用高、准确度高、实用性强、鲁棒性强等优点。
技术关键词
强化学习方法
贪心算法
策略
时延
数据中心
模型更新
学校
资源
表达式
答题数据
学生
决策
标记
鲁棒性
功率
介质
程序
网络