摘要
本申请公开了基于强化学习的动态信贷额度调整系统及方法,该系统包括:实时数据湖,收集用户行为流,获取宏观经济指标,并传输至强化学习决策核心;联邦学习引擎,各参与机构本地部署RL智能体,通过安全聚合协议上传模型梯度至协调服务器,并基于改进的Shapley值算法,量化各机构数据对模型性能的贡献度,用于收益分配,同时将贡献度传输至强化学习决策核心;强化学习决策核心,基于用户行为流和宏观经济指标进行状态空间建模,结合状态空间建模输出动作,实现额度调整和风险预警;提供自适应算法;可解释性引擎;多目标奖励函数动态权衡利息收益、风险抑制及用户生命周期价值,梯度额度调整避免用户感知突变,减少流失风险。
技术关键词
拉普拉斯噪声
协调服务器
动态
多任务损失函数
决策
策略更新
条件风险价值
蒙特卡洛
差分隐私保护
损失函数设计
算法
注意力机制
联邦学习模型
核心
时间差
滑动时间窗口
实时数据
序列