摘要
本发明涉及一种基于提示词鲁棒性的指令数据优选方法、装置及设备。所述方法包括:对用户在线输入的指令数据集中的提示词进行不同类型的攻击,生成对抗指令数据集。采用对抗指令跟随难度评估算法对对抗指令数据集中指令数据进行打分,得到指令数据的对抗指令跟随难度分数。取对抗指令跟随难度分数在排序高位对应的指令数据为高质量数据。采用本方法能够解决了大语言模型对提示词敏感性强、指令执行结果不稳定的问题,实现了精准优选出高质量指令数据的技术效果。
技术关键词
指令
大语言模型
评估算法
一致性算法
在线
鲁棒性
生成答案
度量
字符
数据模块
令牌
处理器
同义词
计算机设备
可读存储介质
存储器
系统为您推荐了相关专利信息
空间点云数据
厂房
三维点云模型
隔墙板
扫描作业
动态评价系统
控制中心
历史信息数据库
客户端
访问系统资源