AI资讯新闻榜单内容搜索-训练

搜索
AI-TNT
搜索: 训练

英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了

英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
6466 AI技术研报
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了
7807 AI技术研报
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

5年白领下岗,AGI靠RL一飞冲天?网友:这是让狗学会打麻将!

5年白领下岗,AGI靠RL一飞冲天?网友:这是让狗学会打麻将!
6902 AI资讯
5年白领下岗,AGI靠RL一飞冲天?网友:这是让狗学会打麻将!

不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B

不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B
6369 AI技术研报
不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南
5766 AI技术研报
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式

7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式
6799 AI技术研报
7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式

舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍

舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍
6211 AI资讯
舍弃CUDA编程!CMU等用几十行代码将LLM编译成巨型内核,推理延迟可降6.7倍

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」
6118 AI技术研报
知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA

月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA
6617 AI资讯
月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA

三个大模型合作,1000次迭代,竟能像人类科学家一样发现方程

三个大模型合作,1000次迭代,竟能像人类科学家一样发现方程
5553 AI技术研报
三个大模型合作,1000次迭代,竟能像人类科学家一样发现方程
上一页 当前第7页,共252页 下一页
沪ICP备2023015588号