AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环

DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环
8098 AI技术研报
DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环

挑战GRPO,英伟达提出GDPO,专攻多奖励优化

挑战GRPO,英伟达提出GDPO,专攻多奖励优化
7825 AI技术研报
挑战GRPO,英伟达提出GDPO,专攻多奖励优化

DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案

DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案
7606 AI技术研报
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案

智能体「卷王」诞生!干活自动配结项报告,1.5张截图就把事说清了

智能体「卷王」诞生!干活自动配结项报告,1.5张截图就把事说清了
8979 AI技术研报
智能体「卷王」诞生!干活自动配结项报告,1.5张截图就把事说清了

打破学科壁垒!400篇参考文献重磅综述,统一调查「人脑×Agent」记忆系统

打破学科壁垒!400篇参考文献重磅综述,统一调查「人脑×Agent」记忆系统
9599 AI技术研报
打破学科壁垒!400篇参考文献重磅综述,统一调查「人脑×Agent」记忆系统

让两个大模型「在线吵架」,他们跑通了全网95%科研代码|深势发布Deploy-Master

让两个大模型「在线吵架」,他们跑通了全网95%科研代码|深势发布Deploy-Master
8850 AI资讯
让两个大模型「在线吵架」,他们跑通了全网95%科研代码|深势发布Deploy-Master

一年后,DeepSeek-R1的每token成本降到了原来的1/32

一年后,DeepSeek-R1的每token成本降到了原来的1/32
8068 AI技术研报
一年后,DeepSeek-R1的每token成本降到了原来的1/32

AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠

AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠
6241 AI技术研报
AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠

大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL
8735 AI技术研报
大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步

MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步
8869 AI资讯
MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步
上一页 当前第35页,共428页 下一页
沪ICP备2023015588号