摘要
本申请提供一种基于强化学习的营销文案自动生成方法、装置及存储介质。该方法包括:对公开文案数据进行语义匹配检索得到候选文案;将插槽化改写指令输入预生成语言模型,生成第一营销文案;对预设基础语言模型执行监督微调训练,得到第一训练模型;输入新的用户产品信息与推广要求至第一训练模型,生成第二营销文案,对第二营销文案进行打分并生成评价数据;根据评价数据构建偏序训练样本,将偏序训练样本作为奖励信号,对第一训练模型执行强化学习训练,得到第二训练模型;在文案生成系统中调用第二训练模型,基于用户的产品信息与推广要求输出目标营销文案。本申请能够实现高合规度且多约束一致的营销文案批量生成。
技术关键词
自动生成方法
评价系统
数据
生成系统
强化学习环境
指令
强化学习算法
模板
可读存储介质
标记
文本
策略
标签
语义向量
处理器
基础
生成装置
输出模块
系统为您推荐了相关专利信息
数据识别模型
数据识别方法
终端设备
异构
iOS操作系统
数据处理模型
特征提取网络
内容结构特征
数据处理方法
图像结构
智能控制方法
低功耗物联网技术
数据
公路
粒子群优化算法