摘要
本发明提供了一种面向认知气泡消解的内容推荐方法,涉及内容推荐领域,该方法包括从获取到的离线交互数据中,提取用户与推荐内容的关键特征,并从兴趣度、过曝光度和认知失调度三方面构建并训练出融合认知感知的满意度模型;采用强化学习框架,结合满意度模型提供的反事实奖励,训练推荐策略模型与去噪状态更新器;在实时交互中,使用滑动时间窗口获取用户历史行为信息,并结合去噪状态更新器得到当前用户状态表征,输入到推荐策略模型中给出推荐内容;将用户对于当前推荐内容的实时反馈记录到数据缓存区中,用于模型微调优化,确保推荐结果能够突破用户固有认知局限,促进积极思想和内容的传播。本发明解决了推荐系统与用户交互过程中存在的认知极化问题。
技术关键词
内容推荐方法
满意度模型
状态更新
交互内容
滑动时间窗口
历史交互信息
气泡
强化学习框架
策略
离线
兴趣
模型更新
强化学习模型
实时数据
强化学习算法
序列
深度学习模型
推荐系统
阶段
系统为您推荐了相关专利信息
紧急控制策略
模型元件参数
故障场景
仿真平台
验证方法
压缩控制方法
储能系统
深度强化学习方法
控制策略
模糊规则库
滑动时间窗口
倾斜传感器
静力水准仪
振动传感器
支护结构