排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1349±8.4 72 - 184 5.5K $0.20 / $0.60 65.5K 1348.908 [1340.6, 1357.3] 18.15 · 不稳 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1343±11.3 118 - 220 2.8K $0.15 / $0.50 65.5K 1343.465 [1332.2, 1354.8] 33.19 · 不稳 Apache 2.0
🥉
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1337±9.7 111 - 210 3.8K $0.15 / $0.50 65.5K 1336.513 [1326.8, 1346.2] 24.57 · 不稳 Apache 2.0
4
180.0
molmo-2-8b Allen AI · Apache 2.0
1308±31.8 143 - 242 374 $0.20 / $0.20 36.9K 1308.061 [1276.2, 1339.9] 263.54 · 不稳 Apache 2.0
5
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1273±13.4 172 - 258 1.6K N/A N/A 1272.718 [1259.3, 1286.1] 46.78 · 不稳 Llama 3.1
6
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1255±13.1 214 - 266 2.0K $0.05 / $0.20 128K 1254.932 [1241.9, 1268.0] 44.53 · 不稳 Apache-2.0
7
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1215±13.8 240 - 291 1.6K N/A N/A 1214.902 [1201.1, 1228.7] 49.25 · 不稳 Llama 3.1
8
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1150±10.9 273 - 319 5.0K N/A N/A 1149.955 [1139.0, 1160.9] 31.17 · 不稳 AI2 ImpACT Low-risk
9
322.0
olmo-7b-instruct Allen AI · Apache-2.0
1067±13.2 306 - 323 4.0K $0.20 / $0.20 N/A 1066.735 [1053.6, 1079.9] 45.08 · 不稳 Apache-2.0

没有找到相关模型