一种基于强化学习的动态反馈推荐方法及装置

正文

推荐专利

申请号：CN202410891424

申请日期：2024-07-04

公开号：CN118964721A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种基于强化学习的动态反馈推荐方法及装置，方法包括：利用因果推理技术预训练用户行为模拟器，生成用户和物品完全交互的反事实用户‑物品二部图；加权聚合真实用户‑物品二部图和反事实用户‑物品二部图，使用Top‑K采样生成交互均衡的用户‑物品二部图；利用图卷积聚合物品的邻域用户信息，获得图结构增强的动作表征；利用门控循环单元和自注意力机制处理用户与推荐系统的交互序列，获得每个时间步的用户状态表征；根据动作表征和用户状态表征预测Q值，基于用户奖励反馈优化推荐模型的动作决策，最终实现对互联网信息的动态反馈推荐。装置包括：处理器和存储器。本发明利用因果推理和图卷积技术引入交互均衡的用户‑物品二部图信息，借助图结构关联丰富和增强智能体动作表征和用户状态表征。

技术关键词

反馈推荐方法模拟器推理技术门控循环单元动态卷积技术邻域 sigmoid函数推荐系统注意力机制生成用户超参数处理器可读存储介质存储器推荐装置节点互联网程序

系统为您推荐了相关专利信息

基于蜂窝网络的低速交通参与者与车辆协同防撞预警系统

防撞预警系统隐私保护模块动态场景数据生命周期管理通信模块

分级分域网络化协同计算系统及工作方法

数据存储单元网关交换网络动态电压频率调节 Paxos算法

数字签名方法、验证方法、装置、设备、存储介质及系统

数字签名方法数字签名验证方法附加值数字签名设备密码算法

一种基于KAN-Film融合模型的建筑围护结构热流预测方法

建筑围护结构室外环境条件数据热阻综合温度

一种基于深度学习的导电油墨丝印精度控制方法

精度控制方法导电油墨模糊C均值聚类算法微裂纹图像

一种基于强化学习的动态反馈推荐方法及装置

站点导航

APP 下载