摘要
本发明提供一种基于评论特征和强化学习的卷烟投放推荐方法及系统,涉及强化学习推荐领域,包括:构建卷烟投放推荐网络;将Su和Si输入评论特征提取模块进行特征提取,获得用户特征向量集合fu和卷烟特征向量集合fi;通过新品卷烟属性类比模块进行属性类比,获得相似度二元组向量集合Sim;将fu、fi和Sim输入卷烟比例计算模块,计算获得基本推荐比例通过需求环境数据和计算获得最终预测投放量。本发明通过强化学习代理网络agent对卷烟投放决策模块进行迭代训练,将需求环境数据和基本推荐比例输入卷烟投放决策模块获得最终预测投放量,从而实现更加精准合理且能自动迭代的卷烟投放决策推荐功能。
技术关键词
卷烟
推荐方法
强化学习代理
特征提取模块
摘要
Softmax函数
决策
数据
网络
稠密特征
分词模型
矩阵
推荐系统
元素
处理器
非线性
指令
文本
系统为您推荐了相关专利信息
大语言模型
网络协议测试方法
测试点
测试设备
两阶段
异常检测方法
记忆
信息传递模块
特征提取模块
多头注意力机制
文件检索方法
非易失性计算机可读存储介质
客户端
摘要
计算机程序产品