摘要
本发明涉及基于深度强化学习的数据产品动态定价方法及系统,属数据产品动态定价、数据交易平台和计算机领域。方法包括:初始化定价环境;构建基于深度强化学习的数据产品动态定价模型;训练数据产品动态定价模型,优化参数并更新模型的权重;利用经过训练的模型对数据产品进行动态定价;四个步骤通过环境处理模块、模型构建模块、训练模块、定价输出模块构成动态定价系统;本发明解决了深度强化学习Deep Q‑Network算法中“探索”与“利用”平衡和经验样本利用效率低的问题,提升数据产品动态定价性能,间接辅助实现数据产品累积收益的最大化。
技术关键词
动态定价方法
深度强化学习
动态定价模型
网络模块
定价模块
动态定价系统
样本
参数
模型更新
数据交易平台
定义
神经网络结构
机制
生成随机数
定价策略