摘要
本发明公开了一种算力自适应的训练模型分配方法、系统及电子设备,涉及无线通信、资源分配领域。所述方法包括:在分割联邦学习框架下构建收敛速率与模型训练延迟综合考虑的优化问题,实现对收敛性和延迟进行权衡;引入辅助变量将所述优化问题分解为资源分配子问题与分割点选择子问题;所述引入的辅助变量为训练中计算延迟的上界和通信延迟的上界;将分割点选择子问题建模为马尔可夫决策过程,并使用深度强化学习算法求解最优策略,获取最优参数向量来实现最优分割点选择策略。本发明通过考虑无线网络环境、异构计算能力以及隐私约束来自适应地动态选择模型分割点,并分配训练资源,可以有效保证模型收敛性并降低延迟。
技术关键词
深度强化学习算法
状态转换概率
资源分配策略
客户端设备
变量
通信资源分配
无线网络环境
联邦学习方法
损失函数优化
决策
参数
电子设备
指标
梯度下降法
框架
分配系统
速率
系统为您推荐了相关专利信息
任务调度策略
服务器集群
终端设备
缓存策略
时延
最大化方法
MEC系统
构建无人机
迭代优化算法
功率
参数优化设计方法
串联机器人
机器人工作空间
坐标系
机器人结构设计