摘要
本发明公开了一种基于从弱到强泛化的大模型提示优化方法、设备、介质,针对原始数据集每个数据对,驱动大模型生成一组候选提示;用每个候选提示生成输出,并与目标文本计算相似度。按相似度高低分组:最高K1%为第一提示,最低K2%为第二提示,其余为第三提示;将输入文本、第一提示、第三提示作为第一数据集;将输入文本、第一提示、第二提示、第三提示作为第二数据集;基于第一数据集,以输入文本、第三提示为输入,以第一提示为目标输出,通过第一损失函数优化提示纠正器;基于第二数据集,以输入文本、第三提示为输入,通过第二损失函数精调优化后的提示纠正器;对待处理任务,先用大模型生成初始提示,输入纠正器即可获得优化后的提示。
技术关键词
文本
纠正器
损失函数优化
数据
大语言模型
处理器
计算机程序产品
表达式
存储器
可读存储介质
电子设备
指令
样本
指标
参数
系统为您推荐了相关专利信息
重离子微孔膜
辐照装置
离子束
机器人滑动装置
真空腔体
动态交通分配
充电站
充放电调度方法
充放电功率
出行需求