摘要
本申请公开了一种基于强化学习的广告效果评估方法及系统,涉及机器学习技术领域,其中方法包括:获取多源数据,包括毫米波雷达数据、WiFi探针数据和匿名二维码数据;构建状态空间;将多源数据代入状态空间得到状态向量;由智能体在状态向量下输出最优动作;基于权重和每种数据的单维度效果评分计算综合效果评分;根据综合效果评分确定即时奖励;根据当前时刻的状态向量、最优动作、即时奖励以及下一时刻的状态向量更新网络参数,优化强化学习模型;将待处理多源数据输入强化学习模型得到广告效果评估结果。本申请采用毫米波雷达+WiFi探针+匿名二维码相结合的方式,不存在隐私风险,而且能够得到较为准确的广告效果评估结果。
技术关键词
WiFi探针
二维码
强化学习模型
广告
雷达
更新网络参数
强化学习框架
计算机存储介质
梯度下降法
电子设备
机器学习技术
深度Q网络
数据获取模块
密度
天气
输出模块
系统为您推荐了相关专利信息
闭环控制方法
节点
动态路径规划
障碍物轨迹预测
匈牙利算法
协同开发方法
知识图谱推理
区块链智能合约
强化学习模型
低代码平台
卷积神经网络模型
面向图像分类
归因
评价方法
像素
机械臂避障路径规划方法
动态障碍物
深度相机
激光雷达
机械臂避障路径规划技术
安防机器人系统
节能方法
压缩感知技术
动态
多传感器采集