AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈
10281 AI技术研报
103K「硬核」题,让大模型突破数学推理瓶颈

华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
9276 AI资讯
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍

英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍
9147 AI技术研报
英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍

10%训练数据超越100%表现,机器人学习领域迎来重要突破

10%训练数据超越100%表现,机器人学习领域迎来重要突破
10913 AI技术研报
10%训练数据超越100%表现,机器人学习领域迎来重要突破

揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路
6862 AI技术研报
揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密
8326 AI技术研报
OpenAI新模型,被曝秘密训练中!万字硬核长文直指o4核心秘密

一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等

一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等
7839 AI技术研报
一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
9044 AI技术研报
时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8

不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine

不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine
7388 AI资讯
不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
10219 AI技术研报
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
上一页 当前第203页,共438页 下一页
沪ICP备2023015588号