强化学习监督的个性化大语言模型Prompt生成方法

AITNT
正文
推荐专利
强化学习监督的个性化大语言模型Prompt生成方法
申请号:CN202411909576
申请日期:2024-12-24
公开号:CN119830013A
公开日期:2025-04-15
类型:发明专利
摘要
本发明提供了强化学习监督的个性化大语言模型Prompt生成方法,该方法包括:将样本数据分别输入到初始Prompt生成模型和预先训练完成的中间Prompt生成模型中得到第一生成Prompt和第二生成Prompt;将第一生成Prompt和对应的第一生成回复输入到奖励模型中得到第一生成Prompt对应的奖励值;基于样本数据、Prompt标签、第一生成Prompt、第二生成Prompt和第一生成Prompt对应的奖励值更新初始Prompt生成模型的参数,以生成大语言模型Prompt。本申请基于第一任务描述样本和对应的第一用户信息样本训练Prompt生成模型,为用户提供个性化回复。
技术关键词
大语言模型 样本 生成方法 标签 生成用户信息 机器可读指令 数据 输入模块 处理器 可读存储介质 参数 电子设备 生成装置 计算机 数值
系统为您推荐了相关专利信息
1
一种畜牧兽医检疫检测设备
畜牧兽医 检测设备 样本固定装置 智能显示终端 微流控芯片
2
一种基于条件扩散的不完全多模态感知数据恢复方法及系统
数据恢复方法 多模态 时间段 语义 标签特征
3
基于后量子秘钥协商的共享秘密生成方法及装置、电子护照口令认证方法
护照 阅读机 口令认证方法 电子 生成会话密钥
4
一种自适应拓扑厂站接线图生成方法
线条 生成方法 节点 图像 设备连接结构
5
审计分析报告生成方法、装置及电子设备
分析报告生成方法 非易失性存储介质 文本 斯皮尔曼相关系数 神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号