一种大语言模型离散提示词搜索方法及装置

AITNT
正文
推荐专利
一种大语言模型离散提示词搜索方法及装置
申请号:CN202510485327
申请日期:2025-04-17
公开号:CN120296148A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种大语言模型离散提示词搜索方法及装置,用于解决现有的离散提示词搜索技术,导致提示词优化的计算开销过大的技术问题。方法包括获取训练提示词和训练句子,并采用预置参数矩阵更新函数根据训练提示词对初始策略模型的初始参数矩阵进行更新,确定中间策略模型;采用中间策略模型和预置生成式语言模型根据训练句子进行推理,生成多个扰动离散提示词和多个推理结果;基于预置梯度计算公式,采用精英坐标下降算法根据多个扰动离散提示词和多个推理结果对中间策略模型的中间参数矩阵进行迭代优化,确定目标策略模型;基于目标策略模型,生成目标离散提示词。
技术关键词
词搜索方法 策略 坐标下降算法 大语言模型 矩阵 参数 噪声模型 计算机程序产品 文本 语义 转换器 可读存储介质 搜索技术 处理器 计算机设备 编码 模块 存储器
系统为您推荐了相关专利信息
1
基于订单管理的企业客户权益赠送全链路追踪方法及系统
链路追踪方法 订单管理 节点 客户 企业
2
一种面向大模型的知识消除学习的参数调整方法及系统
大语言模型 数据 非暂态计算机可读存储介质 矩阵 适配器
3
基于大模型生成评论的方法、模型训练方法、装置及介质
风格 标签 文本 样本 对象
4
一种基于电力生产领域的知识图谱构建方法、系统、设备及介质
知识图谱构建方法 文本 实体关系抽取 HMM模型 数据
5
建筑窗体的损伤识别方法、装置、终端设备及存储介质
建筑窗体 损伤识别模型 损伤识别方法 语义分割模型训练 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号