AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限

Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
9017 AI技术研报
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限

从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手

从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手
7381 AI技术研报
从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
5726 AI技术研报
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换

UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
8742 AI技术研报
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
7181 AI技术研报
扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源

全国产算力!一手实测科大讯飞推理模型星火X1,与R1不相上下?

全国产算力!一手实测科大讯飞推理模型星火X1,与R1不相上下?
10347 AI资讯
全国产算力!一手实测科大讯飞推理模型星火X1,与R1不相上下?

o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩

o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩
8252 AI技术研报
o3被曝「无视」前成果?华人博士生实名指控,谢赛宁等大牛激烈争辩

采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解

采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
6792 AI资讯
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解

让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度

让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度
7381 AI技术研报
让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度

264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与

264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与
8376 AI技术研报
264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与
上一页 当前第240页,共439页 下一页
沪ICP备2023015588号