摘要
本申请涉及一种文本评价器的提示词优化方法、设备及存储介质,属于人工智能技术领域。本申请首先初始化选择策略集群,该选择策略集群包括多个评价提示词的设计因素选择策略;在每一轮迭代中,对选择策略集群中的每一个选择策略施加扰动,生成新的选择策略;基于新的选择策略确定评价提示词,并利用大语言模型在带有人工评价的验证集上生成评价结果;计算评价结果与人工评价的相关系数,基于相关系数,从当前选择策略集群以及新的选择策略中选择更新所述选择策略集群。本申请采用由启发函数引导的迭代搜索方法对选择策略进行优化,同时,对提示词中多个设计因素的选择策略进行优化,扩大了提示词的搜索范围,提升了文本评价器的评价性能。
技术关键词
策略
集群
文本
大语言模型
人工智能技术
优化设备
搜索方法
处理器
可读存储介质
存储器
样本
数值
数据
格式
计算机
代表
定义
参数
系统为您推荐了相关专利信息
视频生成模型
音乐特征
语音特征
视频生成方法
音效
视频特征数据
摄像头控制方法
控制策略模型
实时视频流
多维感知数据
物料识别设备
信号接收环境
识别优化方法
RFID射频
资源调度模型