一种引入特征词的强化学习奖励函数改进方法

正文

推荐专利

申请号：CN202510514952

申请日期：2025-04-23

公开号：CN120429499A

公开日期：2025-08-05

类型：发明专利

摘要

本发明属于推荐算法技术领域，具体涉及一种引入特征词的强化学习奖励函数改进方法。本发明包含以下步骤：S1：提取用户、项目及其交互评论文本，并对其评论文本进行情感分析；S2：设计强化学习模型，定义MDP环境并制定智能体的行动策略网络；S3：将文本进行分词、去除停用词预处理操作，得到标准化词汇集合并转换为单词‑文档矩阵；S4：将构建的单词‑文档矩阵输入到PLSA模型，通过EM算法学习潜在的主题分布，生成评论特征词；S5：引入评论特征词来调整强化学习策略中的奖励函数。本发明通过引入用户评论中的特征词，对策略网络中的奖励函数进行调整，从而充分利用了用户评论中的有用信息。

技术关键词

主题概率潜在语义分析模型文本强化学习策略训练语言模型强化学习模型停用词表评论情感倾向推荐算法技术项目推荐系统 EM算法词语矩阵列表中文分词定义数据

系统为您推荐了相关专利信息

基于知识增强及自适应微调的电力大语言模型构建方法

大语言模型电力 LDA模型主题文本

一种基于动态记忆增强的翻译智能体及构建方法

体构建方法记忆文本语种识别动态

基于图像生成模型的花园设计方法、设备及存储介质

图像生成模型计算机可执行指令图像分割模型场景地理位置信息

一种增强型AI搜索系统

搜索系统模块信息检索服务非结构化文本页面内容

基于大语言模型的老年多重用药的决策方法及装置

信息提取模型大语言模型三元组决策方法医学

一种引入特征词的强化学习奖励函数改进方法

站点导航

APP 下载