排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1262±15.0 72 - 184 1.7K $0.20 / $0.60 65.5K 1262.030 [1247.0, 1277.0] 58.55 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1253±20.8 118 - 220 872 $0.15 / $0.50 65.5K 1252.570 [1231.7, 1273.4] 112.92 · 不稳 Apache 2.0
🥉
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1232±24.8 172 - 258 441 N/A N/A 1231.652 [1206.8, 1256.5] 160.34 · 不稳 Llama 3.1
4
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1226±17.1 111 - 210 1.4K $0.15 / $0.50 65.5K 1225.717 [1208.6, 1242.8] 75.87 · 不稳 Apache 2.0
5
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1199±25.0 214 - 266 567 $0.05 / $0.20 128K 1198.992 [1173.9, 1224.0] 163.27 · 不稳 Apache-2.0
6
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1182±25.5 240 - 291 472 N/A N/A 1181.865 [1156.3, 1207.4] 169.63 · 不稳 Llama 3.1
7
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1105±19.6 273 - 319 1.1K N/A N/A 1105.322 [1085.7, 1124.9] 99.73 · 不稳 AI2 ImpACT Low-risk
8
329.0
olmo-7b-instruct Allen AI · Apache-2.0
990±20.5 306 - 323 1.0K $0.20 / $0.20 N/A 990.079 [969.5, 1010.6] 109.74 · 不稳 Apache-2.0

没有找到相关模型