摘要
本申请公开了一种基于强化学习的广告效果评估方法及系统,涉及机器学习技术领域,其中方法包括:获取多源数据,包括毫米波雷达数据、WiFi探针数据和匿名二维码数据;构建状态空间;将多源数据代入状态空间得到状态向量;由智能体在状态向量下输出最优动作;基于权重和每种数据的单维度效果评分计算综合效果评分;根据综合效果评分确定即时奖励;根据当前时刻的状态向量、最优动作、即时奖励以及下一时刻的状态向量更新网络参数,优化强化学习模型;将待处理多源数据输入强化学习模型得到广告效果评估结果。本申请采用毫米波雷达+WiFi探针+匿名二维码相结合的方式,不存在隐私风险,而且能够得到较为准确的广告效果评估结果。
技术关键词
WiFi探针
二维码
强化学习模型
广告
雷达
更新网络参数
强化学习框架
计算机存储介质
梯度下降法
电子设备
机器学习技术
深度Q网络
数据获取模块
密度
天气
输出模块
系统为您推荐了相关专利信息
人体动作识别方法
点云空间
三维点云信息
雷达
模块
数字孪生仿真系统
智慧水利
立体感
神经网络混合模型
长短期记忆网络