摘要
本发明涉及学习优化技术领域,具体涉及面向大数据分析的深度强化学习优化算法,包括动态特征拓扑图生成:对实时输入的大数据流进行时序关联分析,生成动态特征拓扑图;增强状态空间重构:通过潜在路径挖掘重构出具有时空关联特征的增强状态空间;分层解耦训练:采用梯度隔离机制进行异步参数更新,生成策略梯度流和价值梯度流;多维度决策融合:通过动态权重融合生成多目标优化决策;反馈驱动调整:根据所述多目标优化决策的实际执行效果,反向调整动态特征拓扑图的构建阈值和增强状态空间的维度参数。本发明通过构建动态特征拓扑图,能够实时捕捉大数据流中的时序依赖关系,有效反映特征间的动态演化过程,显著提升了特征建模的灵活性与精度。
技术关键词
面向大数据分析
深度强化学习
拓扑图
策略
网络
状态空间重构
时序关联分析
算法
决策
Softmax函数
生成动作
动态演化过程
时序依赖关系
深度优先遍历
分布特征
参数
滑动时间窗口
分支