样本筛选方法及装置、存储介质及电子设备

AITNT
正文
推荐专利
样本筛选方法及装置、存储介质及电子设备
申请号:CN202510724957
申请日期:2025-05-30
公开号:CN120578960A
公开日期:2025-09-02
类型:发明专利
摘要
本公开提供一种样本筛选方法及装置、存储介质及电子设备,所述样本筛选方法包括:获取原始样本集,所述原始样本集中包含多个原始样本数据。在将所述多个原始样本数据划分为至少两个候选样本集之后,分别计算每一个所述候选样本集与所述原始样本集之间的分布距离,所述分布距离用于表征候选样本集与原始样本集中样本数据的分布差异。当确定所述分布距离小于或等于第一临界距离时,将对应候选样本集中的原始样本数据作为待标注训练样本。这种基于分布一致性的筛选机制,一方面可以有效避免模型对少数类样本的过度关注,另一方面可以确保挑选出来的训练样本能够准确表征原始样本数据的主体分布特征,从而提升模型在主要类别上的性能表现。
技术关键词
样本筛选方法 数据 融合算法 电子设备 处理器 分布特征 筛选装置 模块 可读存储介质 存储器 计算机 机制 程序 指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号