AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
7966 AI技术研报
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败
8013 AI技术研报
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG
6375 AI技术研报
单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达

DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达
7877 AI技术研报
DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达

清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神
8587 AI技术研报
清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
7524 AI技术研报
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考

抛砖引玉 | 为什么DeepSeek-R1是推理模型?(万字长文)

抛砖引玉 | 为什么DeepSeek-R1是推理模型?(万字长文)
10085 AI技术研报
抛砖引玉 | 为什么DeepSeek-R1是推理模型?(万字长文)

AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%
7128 AI技术研报
AI已学会自我复制!复旦新研究:开源LLM克隆成功率最高90%

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025
7851 AI技术研报
推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式

8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式
7163 AI技术研报
8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式
上一页 当前第288页,共446页 下一页
沪ICP备2023015588号