摘要
本发明公开了一种大语言模型离散提示词搜索方法及装置,用于解决现有的离散提示词搜索技术,导致提示词优化的计算开销过大的技术问题。方法包括获取训练提示词和训练句子,并采用预置参数矩阵更新函数根据训练提示词对初始策略模型的初始参数矩阵进行更新,确定中间策略模型;采用中间策略模型和预置生成式语言模型根据训练句子进行推理,生成多个扰动离散提示词和多个推理结果;基于预置梯度计算公式,采用精英坐标下降算法根据多个扰动离散提示词和多个推理结果对中间策略模型的中间参数矩阵进行迭代优化,确定目标策略模型;基于目标策略模型,生成目标离散提示词。
技术关键词
词搜索方法
策略
坐标下降算法
大语言模型
矩阵
参数
噪声模型
计算机程序产品
文本
语义
转换器
可读存储介质
搜索技术
处理器
计算机设备
编码
模块
存储器
系统为您推荐了相关专利信息
大语言模型
数据
非暂态计算机可读存储介质
矩阵
适配器
知识图谱构建方法
文本
实体关系抽取
HMM模型
数据
建筑窗体
损伤识别模型
损伤识别方法
语义分割模型训练
图像