AI资讯新闻榜单内容搜索-强化学习

搜索
AI-TNT
搜索: 强化学习

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
5783 AI技术研报
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
7824 AI技术研报
华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
6084 AI技术研报
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈

o1开启LLM新范式,Ai2科学家解析背后秘籍:推理和强化学习是关键

o1开启LLM新范式,Ai2科学家解析背后秘籍:推理和强化学习是关键
5874 AI技术研报
o1开启LLM新范式,Ai2科学家解析背后秘籍:推理和强化学习是关键

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
5689 AI技术研报
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻

全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
7740 AI资讯
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻

最懂医疗的国产推理大模型,果然来自百川智能

最懂医疗的国产推理大模型,果然来自百川智能
5935 AI资讯
最懂医疗的国产推理大模型,果然来自百川智能

DeepSeek开源o1击毙OpenAI,强化学习惊现「啊哈」时刻!网友:AGI来了

DeepSeek开源o1击毙OpenAI,强化学习惊现「啊哈」时刻!网友:AGI来了
8088 AI资讯
DeepSeek开源o1击毙OpenAI,强化学习惊现「啊哈」时刻!网友:AGI来了

Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生

Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生
7886 AI资讯
Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生

50%优势,力压OpenAI和DeepMind!清华DSAC系列算法全面解析

50%优势,力压OpenAI和DeepMind!清华DSAC系列算法全面解析
7393 AI技术研报
50%优势,力压OpenAI和DeepMind!清华DSAC系列算法全面解析
上一页 当前第14页,共23页 下一页
沪ICP备2023015588号