摘要
本公开涉及一种个性化推荐全局模型训练方法,属于人工智能技术领域。该方法包括:初始化个性化权重、个性化正则化参数;确定个性化推荐评分;确定当前训练批次的总损失;计算总损失关于个性化学生模型中可训练参数的梯度;更新个性化学生模型的可训练参数;调整个性化权重、个性化正则化参数、奖励函数权重;基于奖励函数权重,更新强化学习奖励函数值;基于确定的最优策略参数,最大化奖励;对各个奖励进行聚合,并更新全局权重、全局正则化参数。经过基于强化学习与联邦知识蒸馏的模型训练方法训练得到的模型推荐精度更高,且训练全局模型时通信开销较低,另,通过本方法训练全局模型,能避免隐私泄露。
技术关键词
模型训练方法
全局正则化
正则化参数
学生
推荐系统
标签
客户端
点击率
教师
策略
超参数
人工智能技术
蒸馏
算法
定义
动态
网络
精度
信号
系统为您推荐了相关专利信息
电网数据资产
图谱
数据管理方法
电网业务系统
学生
工艺控制方法
理想气体状态方程
工艺控制系统
表达式
混合物