排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1300±10.7 72 - 184 3.2K $0.20 / $0.60 65.5K 1299.579 [1288.9, 1310.3] 29.79 · 不稳 Apache 2.0
🥈
180.0
molmo-2-8b Allen AI · Apache 2.0
1274±39.9 143 - 242 217 $0.20 / $0.20 36.9K 1274.431 [1234.5, 1314.3] 414.30 · 不稳 Apache 2.0
🥉
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1274±16.0 118 - 220 1.5K $0.15 / $0.50 65.5K 1273.808 [1257.9, 1289.8] 66.25 · 不稳 Apache 2.0
4
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1244±13.3 111 - 210 2.2K $0.15 / $0.50 65.5K 1244.255 [1230.9, 1257.6] 46.26 · 不稳 Apache 2.0
5
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1233±15.6 172 - 258 1.2K N/A N/A 1232.720 [1217.1, 1248.3] 63.35 · 不稳 Llama 3.1
6
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1186±17.4 214 - 266 1.1K $0.05 / $0.20 128K 1186.142 [1168.7, 1203.6] 79.15 · 不稳 Apache-2.0
7
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1174±15.6 240 - 291 1.2K N/A N/A 1174.346 [1158.8, 1189.9] 63.31 · 不稳 Llama 3.1
8
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1110±14.8 273 - 319 2.0K N/A N/A 1110.491 [1095.7, 1125.3] 57.11 · 不稳 AI2 ImpACT Low-risk
9
322.0
olmo-7b-instruct Allen AI · Apache-2.0
978±16.0 306 - 323 1.9K $0.20 / $0.20 N/A 978.397 [962.4, 994.4] 66.69 · 不稳 Apache-2.0

没有找到相关模型