AI资讯新闻榜单内容搜索-LLM

搜索
AI-TNT
搜索: LLM

英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了

英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
6355 AI技术研报
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了
7700 AI技术研报
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南
5646 AI技术研报
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍

舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍
6131 AI资讯
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」
6029 AI技术研报
知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

解读大型推理模型的 “思维奥秘”:从“推理图”视角看模型的「啊哈时刻」

解读大型推理模型的 “思维奥秘”:从“推理图”视角看模型的「啊哈时刻」
5862 AI资讯
解读大型推理模型的 “思维奥秘”:从“推理图”视角看模型的「啊哈时刻」

ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%

ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%
6804 AI技术研报
ICML 2025 Oral | NAS老树开新花,NUS提出智能体超网,成本狂降55%

推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本

推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本
7573 AI技术研报
推荐大模型来了?OneRec论文解读:端到端训练如何同时吃掉效果与成本

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究
7163 AI技术研报
DPO与GRPO谁更胜一筹?港中文、北大等联合发布首个系统性对比研究

20个样本,搞定多模态思维链!UCSC重磅开源:边画框,边思考

20个样本,搞定多模态思维链!UCSC重磅开源:边画框,边思考
7189 AI技术研报
20个样本,搞定多模态思维链!UCSC重磅开源:边画框,边思考
上一页 当前第1页,共108页 下一页
沪ICP备2023015588号