摘要
本发明属于推荐算法技术领域,具体涉及一种引入特征词的强化学习奖励函数改进方法。本发明包含以下步骤:S1:提取用户、项目及其交互评论文本,并对其评论文本进行情感分析;S2:设计强化学习模型,定义MDP环境并制定智能体的行动策略网络;S3:将文本进行分词、去除停用词预处理操作,得到标准化词汇集合并转换为单词‑文档矩阵;S4:将构建的单词‑文档矩阵输入到PLSA模型,通过EM算法学习潜在的主题分布,生成评论特征词;S5:引入评论特征词来调整强化学习策略中的奖励函数。本发明通过引入用户评论中的特征词,对策略网络中的奖励函数进行调整,从而充分利用了用户评论中的有用信息。
技术关键词
主题
概率潜在语义分析模型
文本
强化学习策略
训练语言模型
强化学习模型
停用词表
评论情感倾向
推荐算法技术
项目推荐系统
EM算法
词语
矩阵
列表
中文分词
定义
数据
系统为您推荐了相关专利信息
图像生成模型
计算机可执行指令
图像分割模型
场景
地理位置信息
搜索系统
模块
信息检索服务
非结构化文本
页面内容