强化学习监督的个性化大语言模型Prompt生成方法

正文

推荐专利

申请号：CN202411909576

申请日期：2024-12-24

公开号：CN119830013A

公开日期：2025-04-15

类型：发明专利

摘要

本发明提供了强化学习监督的个性化大语言模型Prompt生成方法，该方法包括：将样本数据分别输入到初始Prompt生成模型和预先训练完成的中间Prompt生成模型中得到第一生成Prompt和第二生成Prompt；将第一生成Prompt和对应的第一生成回复输入到奖励模型中得到第一生成Prompt对应的奖励值；基于样本数据、Prompt标签、第一生成Prompt、第二生成Prompt和第一生成Prompt对应的奖励值更新初始Prompt生成模型的参数，以生成大语言模型Prompt。本申请基于第一任务描述样本和对应的第一用户信息样本训练Prompt生成模型，为用户提供个性化回复。

技术关键词

大语言模型样本生成方法标签生成用户信息机器可读指令数据输入模块处理器可读存储介质参数电子设备生成装置计算机数值

系统为您推荐了相关专利信息

一种畜牧兽医检疫检测设备

畜牧兽医检测设备样本固定装置智能显示终端微流控芯片

一种基于条件扩散的不完全多模态感知数据恢复方法及系统

数据恢复方法多模态时间段语义标签特征

基于后量子秘钥协商的共享秘密生成方法及装置、电子护照口令认证方法

护照阅读机口令认证方法电子生成会话密钥

一种自适应拓扑厂站接线图生成方法

线条生成方法节点图像设备连接结构

审计分析报告生成方法、装置及电子设备

分析报告生成方法非易失性存储介质文本斯皮尔曼相关系数神经网络模型

强化学习监督的个性化大语言模型Prompt生成方法

站点导航

APP 下载