排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1317±12.6 72 - 184 2.2K $0.20 / $0.60 65.5K 1316.776 [1304.2, 1329.4] 41.49 · 不稳 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1291±18.2 118 - 220 1.1K $0.15 / $0.50 65.5K 1290.752 [1272.6, 1308.9] 86.07 · 不稳 Apache 2.0
🥉
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1253±15.9 111 - 210 1.5K $0.15 / $0.50 65.5K 1252.868 [1236.9, 1268.8] 66.11 · 不稳 Apache 2.0
4
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1226±33.0 172 - 258 288 N/A N/A 1225.932 [1192.9, 1259.0] 283.95 · 不稳 Llama 3.1
5
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1196±32.5 240 - 291 285 N/A N/A 1196.366 [1163.8, 1228.9] 275.65 · 不稳 Llama 3.1
6
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1181±33.0 214 - 266 336 $0.05 / $0.20 128K 1180.988 [1148.0, 1213.9] 282.79 · 不稳 Apache-2.0
7
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1077±25.9 273 - 319 540 N/A N/A 1077.267 [1051.4, 1103.1] 174.31 · 不稳 AI2 ImpACT Low-risk
8
322.0
olmo-7b-instruct Allen AI · Apache-2.0
1020±26.5 306 - 323 548 $0.20 / $0.20 N/A 1019.500 [993.0, 1046.0] 183.19 · 不稳 Apache-2.0

没有找到相关模型