摘要
本公开公开了数据筛选方法、装置、电子设备及存储介质,涉及计算机领域,尤其涉及大模型、深度学习、自然语言处理等人工智能技术领域。具体实现方案为:首先获取多个第一意图分别关联的多个候选样本集,每个第一意图在所有样本中的第一出现频率,及待微调模型的模型参数,然后对每个候选样本集中的样本进行聚类,得到每个第一意图对应的多个簇,之后基于模型参数,确定每个簇内每个样本的第一影响力值,及该样本关联的第二影响力值,最后根据第一影响力值、第二影响力值及第一出现频率,对每个簇内的样本进行筛选。
技术关键词
样本
意图
数据筛选方法
复杂度
频率
参数
数据筛选装置
聚类
电子设备
指数
人工智能技术
计算机程序产品
处理器通信
自然语言
指令
可读存储介质
模块
系统为您推荐了相关专利信息
可信计算方法
后门
卷积神经网络模型
多阶段
评估指标体系
时间滑动窗口
检测流水线
网络
注意力机制
XGBoost算法
协同服务方法
多模型协同
答案
数据
资源利用率最大化
回归预测模型
训练样本集
图像
深度残差网络模型
识别设备
图像视觉特征
车载摄像头
语言理解模型
语义特征
文本