摘要
本申请实施例提供了一种数据筛选方法和装置、电子设备及存储介质,属于数据筛选技术领域。该方法包括:获取信息样本数据及信息噪声数据,其中,信息噪声数据表示干扰信息的数据;对信息样本数据及信息噪声数据进行相似度计算,得到数据相似度;基于数据相似度,对信息样本数据进行数据分类,得到样本数据类型,其中,样本数据类型包括噪声增量数据及目标信息数据;对信息噪声数据及噪声增量数据进行数据合并,得到目标噪声数据;基于目标信息数据及目标噪声数据,对预设的初始数据分类模型进行模型训练,得到目标数据分类模型;基于目标数据分类模型,对预设的信息收集数据进行数据筛选。本申请实施例能够提高信息数据筛选的准确率。
技术关键词
数据分类模型
噪声数据
文本
数据筛选方法
噪声样本
信息编码
数据筛选技术
数据筛选装置
数据标签
数据编码
电子设备
模型训练模块
可读存储介质
数据获取模块
注意力
处理器
系统为您推荐了相关专利信息
数据配置技术
生成业务
指标
机器可读程序
数字型
TextRank算法
监测模块
数据安全机制
多模态信息融合
动态规划算法
智能审核方法
人事档案
大语言模型
可信度向量
跨模态