摘要
本发明公开了多模态大模型数据清洗与特征增强的预处理方法及系统,涉及数据处理技术领域。包括信息获取:获取多模态大模型需要使用的数据得到待处理数据。本发明通过设置的数据处理方法根据分类结果对待处理数据进行对应的清洗处理,通过数据增强方法根据分类结果对完成数据进行对应的增强处理,在数据清洗和特征增强的过程中,结合数据的领域信息,对数据进行对应的清洗和增强,以适应不同场景的数据,提高数据清洗和特征增强的动态适应性,且降低增强偏离和语义割裂的几率,达到提高数据处理效率和质量的效果,且分类结果的范围大小可根据用户需求决定,可决定数据清洗和特征增强过程中追求精度还是效率,以提高用户的使用体验。
技术关键词
数据处理方法
回溯方法
交叉验证方法
分类方法
多模态
关系
数据处理技术
格式
存储库
语义
文本
音频
场景
动态
图像
精度