一种结构化数据的训练数据筛选方法、装置、设备及介质

AITNT
正文
推荐专利
一种结构化数据的训练数据筛选方法、装置、设备及介质
申请号:CN202410760717
申请日期:2024-06-13
公开号:CN118503812A
公开日期:2024-08-16
类型:发明专利
摘要
本申请公开了一种结构化数据的训练数据筛选方法、装置、设备及介质,涉及数据筛选领域,包括:获取待分类分级的结构化样本各维度的元数据信息,并分别对各维度的所述元数据信息进行向量化表示,以得到各向量化表示样本;对各所述向量化表示样本分别进行加权求和,以基于相应的加权结果确定各最终向量化表示样本,对各所述最终向量化表示样本进行聚类,获取相应的聚类结果;利用所述聚类结果对所述待分类分级的结构化样本进行筛选,以得到筛选结果,并基于所述筛选结果确定所述待分类分级的结构化样本的初始训练数据。由此,本申请能够实现对初始训练数据的高质量、有效筛选。
技术关键词
数据筛选方法 样本 聚类 数据筛选装置 打标工作 校验规则 模块 可读存储介质 处理器 算法 电子设备 字典 语句 参数 存储器 计算机
系统为您推荐了相关专利信息
1
基于轻量化BiLSTM的手语识别系统及应用
手语识别系统 上肢 坐标 识别模块 学生
2
一种基于大模型和机器学习模型融合的中小微企业融资担保额度测算方法及系统
机器学习模型 企业 样本 检索数据库信息 数值
3
基于动态机器学习联合校正模型的古生物多样性分析方法
动态机器 分析方法 混合方法 权重方法 校正
4
嵌入图像提示适配器的图像生成方法、装置、设备及存储介质
图像生成方法 图像生成模型 注意力 适配器 样本
5
草原地表覆盖物识别方法、装置及相关模型训练方法
地表覆盖物 特征融合网络 特征提取网络 边缘检测 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号