AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性
11425 AI技术研报
豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解
5343 AI技术研报
Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑

OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
7570 AI资讯
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑

MSRA:视觉生成六大技术问题

MSRA:视觉生成六大技术问题
11050 AI技术研报
MSRA:视觉生成六大技术问题

OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级

OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
10091 AI资讯
OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级

ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率

ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率
11354 AI技术研报
ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
10236 AI资讯
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平

生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平
10559 AI技术研报
生成式模型不只会「模仿」!哈佛、UCSB等最新成果:性能可超越训练集专家水平

Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍

Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
10503 AI技术研报
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍

H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍

H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍
10598 AI资讯
H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍
上一页 当前第388页,共451页 下一页
沪ICP备2023015588号