ATLAS

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
ATLAS
访问
0
14749

基准测试


ATLAS 是 Google DeepMind 提出的 AGI 进展评测基准,源自 2026 年的认知框架研究论文。不同于多数测试训练数据中已有知识的基准,它通过程序生成的交互式环境,要求模型在实时试错中发现隐藏规则,每个任务都是全新的学习问题。







沪ICP备2023015588号