摘要
本发明提供一种面向多模态数据集的智能分类分级方法,包括:利用数据接入模块,通过流式数据源和批数据源接入多模态数据集,并根据数据集规模判断是否触发数据集压缩流程;在数据集的数据规模超过预设阈值时,通过聚类分析和降维处理等手段生成Coreset数据集,实现对数据集的高效压缩和代表性样本提取;对Coreset数据集进行深度处理,包括数据清洗和特征分析,针对不同模态数据采用相应的处理技术;基于深度学习模型对处理后的数据集进行多模态内容识别与分类,得到分类结果;结合规则引擎和熵权法对分类结果进行多维度评估,确定权重分配,为数据集分级提供量化依据;采用智能化的多维度评估方法,对数据集进行最终分类与分级,得到分类分级结果。
技术关键词
面向多模态数据
分类分级方法
多维度评估方法
深度学习模型
Word2Vec模型
关键视觉信息
音频数据处理
规模
直方图均衡化
清洗算法
无监督学习
处理器
分级装置
数据处理模块
融合策略
模糊逻辑
注意力机制
系统为您推荐了相关专利信息
三元乙丙橡胶材料
多模态传感器
区域生长算法
光纤光栅传感器阵列
材料性能检测技术
划线检测方法
频域特征
像素点
激光
深度学习模型
LSTM模型
分类准确率
图像
人工智能交叉技术
混合深度学习模型
文本预测方法
LSTM模型
Word2Vec模型
状态更新
注意力模型融合
基础
数据分析模块
语言分析
数据收集模块
风险评估模型