摘要
本申请公开了一种筛选指令数据的方法。对所有指令数据采用奖励模型进行打分,在打分的过程中还对所有指令数据进行分类,在每个类别的指令数据中选出打分靠前的一部分指令数据。将第一次筛选出的指令数据转化成稠密向量,然后采用聚类方法对稠密向量形式的第一次筛选出的指令数据进行聚类,生成多个簇,并取每个簇的部分指令数据构成种子指令。利用种子指令训练指令模型A。将所有第一次筛选出的指令数据用指令模型A进行回答,回答结果再用奖励模型进行打分,在打分的过程中还对其进行分类,在每个类别中选出打分靠后的一部分构成增强指令。利用种子指令和增强指令训练指令模型B。本申请将用于训练指令模型的指令数据的量大幅减少。
技术关键词
指令
数据
种子
基础
谱聚类方法
词嵌入模型
聚类算法
噪声
密度
系统为您推荐了相关专利信息
校准算法
拉曼光谱数据
拉曼光谱系统
探测器
统计分析方法
高精密数控
冲压控制方法
多参数
改进型粒子群优化算法
实时数据