训练数据去重方法、装置和设备

AITNT
正文
推荐专利
训练数据去重方法、装置和设备
申请号:CN202510219738
申请日期:2025-02-26
公开号:CN120316408A
公开日期:2025-07-15
类型:发明专利
摘要
本发明提供一种训练数据去重方法、装置和设备,其中方法包括:获取多条新多模态训练数据和多条历史多模态训练数据;提取每条新多模态训练数据对应的第一多维特征信息,并提取每条历史多模态训练数据对应的第二多维特征信息;对每条新多模态训练数据对应的第一多维特征信息进行融合,得到相应的第一融合特征信息,对每条历史多模态训练数据对应的第二多维特征信息进行融合,得到相应的第二融合特征信息;基于每条新多模态训练数据对应的第一融合特征信息,以及每条历史多模态训练数据对应的第二融合特征信息,对多条新多模态训练数据进行去重。本发明能够对新多模态训练数据进行语义级去重,提高了数据去重的效率和精准度。
技术关键词
数据去重方法 融合特征 多模态 音频特征 样本 图像 文本 数据去重装置 特征提取单元 处理器 数据存储 存储器 对象 电子设备 语义
系统为您推荐了相关专利信息
1
基于深度强化学习的铁路电力设备故障预测方法
铁路电力设备 降噪稀疏自动编码器 深度强化学习算法 故障预测方法 协方差矩阵
2
一种干式整流变压器散热方法及系统
干式整流变压器 低压线圈 温升 散热方法 高压线圈
3
一种多传感器监测的滑坡预警方法、装置、设备及介质
滑坡预警方法 传感器监测 多传感器 监测边坡 环境传感器
4
基于多模态数据融合与深度学习的蓝藻水华监测方法
蓝藻水华监测方法 多模态数据融合 时序特征 长短期记忆网络 卷积神经网络提取
5
一种零样本图像文本转换方法及装置
解码器模型 文本转换方法 实体 图像 图文
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号