基于异常检测的多模态预训练数据集清洗方法及装置

AITNT
正文
推荐专利
基于异常检测的多模态预训练数据集清洗方法及装置
申请号:CN202411612403
申请日期:2024-11-13
公开号:CN119357673A
公开日期:2025-01-24
类型:发明专利
摘要
本发明提供了一种基于异常检测的多模态预训练数据集清洗方法及装置,具有这样的特征,包括步骤S1,构建特征提取器,并根据多模态大数据集对特征提取器进行训练,得到训练好的特征提取器;步骤S2,对各个数据点,通过训练好的特征提取器提取各个不同模态的数据对应的特征;步骤S3,根据各个数据点的所有特征,通过局部异常检测方法,计算得到各个数据点的不同模态的数据对应的异常值;步骤S4,根据各个数据点的所有异常值,选取多个数据点作为异常点,并将剔除异常点的多模态大数据集作为清洗数据集。总之,本方法能够自动且高效地剔除数据中的异常样本。
技术关键词
数据集清洗方法 特征提取器 多模态大数据 异常检测方法 异常点 表达式 特征提取模块 样本 数值 本质 参数
系统为您推荐了相关专利信息
1
一种基于物联网的公共建筑环境监控系统
动态网格 环境监控系统 多路径 时间域 多元回归模型
2
基于AI模型的排水入流入渗诊断方法
地理模型 监测点 监测仪器 诊断方法 排水设施
3
一种顾及地类的多光谱遥感图像深度光谱超分方法
超分方法 上采样 多光谱 图像 加权平均法
4
基于动态校准机制的供电所综合线损率评价方法
校准机制 评价方法 动态阈值区间 线路 异常数据
5
一种基于SNN网络的虚实迁移装备故障预测方法及系统
装备故障预测方法 特征提取模块 设备全寿命周期 特征提取器 脉冲
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号