针对算力集群的通信方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
针对算力集群的通信方法、装置、电子设备及存储介质
申请号:CN202411814939
申请日期:2024-12-11
公开号:CN119299057B
公开日期:2025-04-04
类型:发明专利
摘要
本公开提供了一种针对算力集群的通信方法、装置、电子设备及存储介质,涉及图形处理器、算力集群、模型训练、生成式大语言模型等技术领域。该方法包括:在采用RDMA协议与通信接收端进行通信的过程中,获取与RDMA协议对应的第一丢包率;响应于第一丢包率高于第一预设丢包率,向通信接收端发起切换为TCP进行通信的第一握手请求;接收通信接收端针对第一握手请求返回的第一握手响应,并根据第一握手响应中的最后数据接收位置确定数据的第一起始传输位置;采用TCP从与第一起始传输位置对应的数据开始与通信接收端进行通信。应用该方法可提升整体通信效率和数据传输量,进而提升生成式大语言模型的训练效率以及缩短训练所需耗时。
技术关键词
RDMA协议 接收端 集群 时延 大语言模型 图形处理器 通信方法 RDMA网卡 数据 控制单元 通信单元 机房 电子设备 计算机程序产品 通信效率 处理器通信
系统为您推荐了相关专利信息
1
CPU/GPU异构系统的信息获取方法及系统
异构系统 信息获取方法 存储系统 GPU异构集群 命令
2
层次化视频搜索排名优化方法及装置
语义 视频搜索 生成视频片段 语句 大语言模型
3
一种基于扩散模型的蛋白质构象系综建模方法
建模方法 大语言模型 构象特征 物理 选取结构
4
一种基于混合消息传递的OTFS信号检测方法
消息传递算法 信号检测方法 信号检测器 多普勒 双选择性信道
5
一种基于融合信息的大模型输出生成方法、介质及设备
大语言模型 数据知识库 行程 生成方法 字段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号