排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1348±28.5 72 - 184 427 $0.20 / $0.60 65.5K 1348.107 [1319.6, 1376.6] 211.11 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1329±40.1 118 - 220 202 $0.15 / $0.50 65.5K 1329.176 [1289.1, 1369.2] 417.73 · 不稳 Apache 2.0
🥉
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1299±31.3 111 - 210 341 $0.15 / $0.50 65.5K 1298.806 [1267.5, 1330.1] 255.70 · 不稳 Apache 2.0
4
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1246±28.0 172 - 258 349 N/A N/A 1246.081 [1218.0, 1274.1] 204.76 · 不稳 Llama 3.1
5
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1195±30.2 214 - 266 336 $0.05 / $0.20 128K 1195.009 [1164.8, 1225.2] 237.15 · 不稳 Apache-2.0
6
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1192±29.5 240 - 291 304 N/A N/A 1192.477 [1163.0, 1222.0] 226.66 · 不稳 Llama 3.1
7
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1099±20.5 273 - 319 751 N/A N/A 1098.740 [1078.2, 1119.3] 109.64 · 不稳 AI2 ImpACT Low-risk
8
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1018±20.5 306 - 323 726 $0.20 / $0.20 N/A 1017.901 [997.4, 1038.4] 109.70 · 不稳 Apache-2.0

没有找到相关模型