一种引入特征词的强化学习奖励函数改进方法

AITNT
正文
推荐专利
一种引入特征词的强化学习奖励函数改进方法
申请号:CN202510514952
申请日期:2025-04-23
公开号:CN120429499A
公开日期:2025-08-05
类型:发明专利
摘要
本发明属于推荐算法技术领域,具体涉及一种引入特征词的强化学习奖励函数改进方法。本发明包含以下步骤:S1:提取用户、项目及其交互评论文本,并对其评论文本进行情感分析;S2:设计强化学习模型,定义MDP环境并制定智能体的行动策略网络;S3:将文本进行分词、去除停用词预处理操作,得到标准化词汇集合并转换为单词‑文档矩阵;S4:将构建的单词‑文档矩阵输入到PLSA模型,通过EM算法学习潜在的主题分布,生成评论特征词;S5:引入评论特征词来调整强化学习策略中的奖励函数。本发明通过引入用户评论中的特征词,对策略网络中的奖励函数进行调整,从而充分利用了用户评论中的有用信息。
技术关键词
主题 概率潜在语义分析模型 文本 强化学习策略 训练语言模型 强化学习模型 停用词表 评论情感倾向 推荐算法技术 项目推荐系统 EM算法 词语 矩阵 列表 中文分词 定义 数据
系统为您推荐了相关专利信息
1
基于知识增强及自适应微调的电力大语言模型构建方法
大语言模型 电力 LDA模型 主题 文本
2
一种基于动态记忆增强的翻译智能体及构建方法
体构建方法 记忆 文本 语种识别 动态
3
基于图像生成模型的花园设计方法、设备及存储介质
图像生成模型 计算机可执行指令 图像分割模型 场景 地理位置信息
4
一种增强型AI搜索系统
搜索系统 模块 信息检索服务 非结构化文本 页面内容
5
基于大语言模型的老年多重用药的决策方法及装置
信息提取模型 大语言模型 三元组 决策方法 医学
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号