摘要
本发明提供一种训练数据去重方法、装置和设备,其中方法包括:获取多条新多模态训练数据和多条历史多模态训练数据;提取每条新多模态训练数据对应的第一多维特征信息,并提取每条历史多模态训练数据对应的第二多维特征信息;对每条新多模态训练数据对应的第一多维特征信息进行融合,得到相应的第一融合特征信息,对每条历史多模态训练数据对应的第二多维特征信息进行融合,得到相应的第二融合特征信息;基于每条新多模态训练数据对应的第一融合特征信息,以及每条历史多模态训练数据对应的第二融合特征信息,对多条新多模态训练数据进行去重。本发明能够对新多模态训练数据进行语义级去重,提高了数据去重的效率和精准度。
技术关键词
数据去重方法
融合特征
多模态
音频特征
样本
图像
文本
数据去重装置
特征提取单元
处理器
数据存储
存储器
对象
电子设备
语义
系统为您推荐了相关专利信息
铁路电力设备
降噪稀疏自动编码器
深度强化学习算法
故障预测方法
协方差矩阵
干式整流变压器
低压线圈
温升
散热方法
高压线圈
滑坡预警方法
传感器监测
多传感器
监测边坡
环境传感器
蓝藻水华监测方法
多模态数据融合
时序特征
长短期记忆网络
卷积神经网络提取