摘要
本公开提供了一种数据集均衡处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及深度学习、多模态训练以及分布式大模型训练优化等技术领域。具体实现方案为:获取多个待处理多模态数据的数据大小,得到原始数据集;计算原始数据集的平均值,得到基准值;将原始数据集中的数据与基准值进行计算,并根据计算结果确定最大堆和最小堆;通过交换最大堆和最小堆中的数据量来动态调整原始数据集中的数据量,以使得原始数据集中的数据量达到均衡。本公开实现了数据集中的数据量均衡,不仅提高了计算效率,还优化了资源利用率,确保了并行计算任务的高效执行。
技术关键词
数值
数据
多模态
视频编码
模块
电子设备
人工智能技术
动态
计算机程序产品
处理器通信
指令
可读存储介质
存储器
图像
资源
系统为您推荐了相关专利信息
联合检测方法
编解码结构
编码器
序列特征
情感特征
声谱
水听器
机械运动系统
声音MFCC特征
摄像机
智能麻醉
安全监控方法
PID控制器
患者
麻醉药品