一种并行环境的GPU程序优化方法
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
一种并行环境的GPU程序优化方法
申请号:
CN202511543422
申请日期:
2025-10-28
公开号:
CN121029422A
公开日期:
2025-11-28
类型:
发明专利
摘要
本申请提供了一种并行环境的GPU程序优化方法,多个目标模型被配置于GPU集群中进行并行训练,该方法包括:对目标模型的并行训练配置进行策略配置与内存瓶颈预判;利用预判结果,通过并行策略组合与指令级性能监测进行吞吐量优化;对优化过程中出现的指令级瓶颈进行内核重优化,使得模型训练与GPU指令执行效率同步提升。
技术关键词
存储器访问效率
并行策略
程序优化方法
指令执行效率
性能预测模型
瓶颈
内核
内存
流水线指令
指令流水线
全局存储器
反馈控制系统
数据
集群
分析工具
动态
规模
沪ICP备2023015588号