一种强化学习推荐系统的多模型去噪方法及系统

正文

推荐专利

申请号：CN202510168968

申请日期：2025-02-17

公开号：CN119647630A

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了一种强化学习推荐系统的多模型去噪方法及系统，所述去噪方法包括：获取含噪声交互数据，使用广义矩阵分解模型和其他两种矩阵分解模型作为预测模型对含噪声交互数据进行预测；通过最小化多个预测模型之间拟合的真实用户偏好分布的KL散度，同时最大化给定真实用户偏好条件下观测数据的似然，以此优化预测模型参数；经优化后的预测模型作为教师模型，并通过降噪正样本噪声和降噪负样本噪声对教师模型训练得到去噪教师模型；构建学生模型，并定义目标损失函数。本发明利用上述去噪算法训练去噪用户模型，用于和在线强化学习策略交互，提供更符合用户真实偏好的反馈，提高强化学习推荐方法的噪音鲁棒性和推荐性能。

技术关键词

模型去噪方法学习推荐系统矩阵分解模型教师优化预测模型噪声学生样本模型训练模块非暂态计算机可读存储介质学习推荐方法强化学习策略数据去噪系统定义去噪算法参数广义标签

系统为您推荐了相关专利信息

一种基于职业教育智能化公共实训平台的构建方法及系统

实训车间实训平台策略优化模型任务分配信息职业

一种具有多语言自动转换功能的助听器及助听器系统

多语言助听器系统翻译模型学生样本

教学方案生成方法、系统、一体机及存储介质

历史教学生成方法主题中文教育编辑

一种面向智能驾驶场景的图像文本特征融合域适应目标检测方法

面向智能驾驶语义特征教师风格学生

一种面向复杂遥感场景的半监督目标检测方法

监督学习方法预测特征教师学生样本

一种强化学习推荐系统的多模型去噪方法及系统

站点导航

APP 下载