摘要
本发明涉及数据处理技术领域,提供了一种利用强化学习优化的信贷额度评估方法及系统。该方法包括,获取用户数据和市场数据,并依次进行预处理和状态向量转换;基于状态向量转换后的用户数据和市场数据,动态调整额度区间;基于状态向量转换后的所有数据,训练深度Q网络,以额度区间为动作空间,得到Q值;基于动作选择策略结合奖励函数,将Q值与额度区间进行映射,选择分配额度;在深度Q网络的损失满足预设条件时,得到训练好的深度Q网络;获取预授信额度查看请求,以获取目标用户数据和市场数据,并依次进行预处理和状态向量转换;将状态向量转换后的所有数据输入训练好的深度Q网络,得到目标预授信额度。
技术关键词
额度评估方法
深度Q网络
行业景气指数
可读存储介质
计算机程序产品
连续动作空间
编码向量
职业
数据处理技术
梯度算法
策略
处理器
年龄
频率
数值
指标
评估系统
系统为您推荐了相关专利信息
AI识别技术
施工控制方法
AI算法
工件缺陷检测
缺陷知识库
机器人导航系统
量子状态空间
智能化机器人
导航方法
感知机器人
远程数据采集系统
信息采集单元
强直性脊柱炎
数据采集方法
联合损失函数
信息安全识别方法
客户端
参数
长短记忆网络
随机梯度下降