摘要
本发明公开一种用于分布式嵌入向量的训练方法及装置,涉及深度学习领域,包括批量读取训练数据,根据各训练数据的ID,确定训练数据对应的位置信息;根据位置信息,确定训练数据对应的嵌入向量;根据各嵌入向量的访问频率和预先确定的元素数量,确定各嵌入向量是否复制至第一类型的特征向量块;若是,从第一类型的特征向量块获取嵌入向量,并对嵌入向量执行数据并行策略;若否,根据位置信息,从第二类型的特征向量块获取嵌入向量,并对嵌入向量执行模型并行策略。本申请能够快速准确定位嵌入向量的存储位置,为训练过程提供高效数据支持;并根据嵌入向量的访问频率,采用两种不同的并行策略,充分利用数据的稀疏访问模式,有效减少通信开销。
技术关键词
数据并行策略
进程
计算机程序产品
元素
哈希表
索引表
流水线方式
处理器
可读存储介质
频率
搜索算法
批量
训练装置
分片
模块
存储器
系统为您推荐了相关专利信息
实体
信息推荐方法
模型训练方法
关系
数据处理方法
防滑控制方法
车轮
路面附着系数
制动模块
防滑控制装置
图片
文本编辑框
场景深度图
计算机可执行指令
轮廓
设备故障识别方法
预测特征
序列
综合故障
历史运行数据
交通流预测方法
预测交通状况
卷积模块
神经网络模型
时空卷积神经网络