AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当
9039 AI技术研报
大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
7731 AI资讯
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

最新研究揭示AI数据之殇:科技巨头垄断权力,「西方中心」数据加剧模型偏见

最新研究揭示AI数据之殇:科技巨头垄断权力,「西方中心」数据加剧模型偏见
7721 AI技术研报
最新研究揭示AI数据之殇:科技巨头垄断权力,「西方中心」数据加剧模型偏见

AI“硬控”拜年

AI“硬控”拜年
8217 AI资讯
AI“硬控”拜年

UC伯克利等最新实锤:LLM就是比人类啰嗦,「提问的艺术」仍难参透

UC伯克利等最新实锤:LLM就是比人类啰嗦,「提问的艺术」仍难参透
5551 AI技术研报
UC伯克利等最新实锤:LLM就是比人类啰嗦,「提问的艺术」仍难参透

原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的
9702 AI技术研报
原来,这些顶级大模型都是蒸馏的

新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」

新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」
8089 AI技术研报
新范式,自回归大一统!北大提出VARGPT:单一框架实现视觉「理解」与「生成」

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步
5597 AI技术研报
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

DeepSeek,改变了AI的游戏规则

DeepSeek,改变了AI的游戏规则
6390 AI资讯
DeepSeek,改变了AI的游戏规则

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
7621 AI技术研报
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
上一页 当前第294页,共447页 下一页
沪ICP备2023015588号