排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1312±6.1 72 - 184 12.2K $0.20 / $0.60 65.5K 1312.069 [1306.0, 1318.2] 9.75 · 波动 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1299±8.2 118 - 220 6.0K $0.15 / $0.50 65.5K 1298.528 [1290.3, 1306.8] 17.67 · 不稳 Apache 2.0
🥉
180.0
molmo-2-8b Allen AI · Apache 2.0
1294±21.5 143 - 242 804 $0.20 / $0.20 36.9K 1293.829 [1272.3, 1315.3] 120.28 · 不稳 Apache 2.0
4
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1271±7.3 111 - 210 8.5K $0.15 / $0.50 65.5K 1270.706 [1263.4, 1278.0] 13.77 · 不稳 Apache 2.0
5
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1256±10.6 172 - 258 2.8K N/A N/A 1255.667 [1245.1, 1266.2] 29.15 · 不稳 Llama 3.1
6
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1218±10.9 214 - 266 3.3K $0.05 / $0.20 128K 1217.805 [1206.9, 1228.7] 30.85 · 不稳 Apache-2.0
7
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1193±10.6 240 - 291 2.9K N/A N/A 1193.249 [1182.6, 1203.9] 29.43 · 不稳 Llama 3.1
8
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1121±9.9 273 - 319 6.5K N/A N/A 1120.964 [1111.1, 1130.9] 25.55 · 不稳 AI2 ImpACT Low-risk
9
322.0
olmo-7b-instruct Allen AI · Apache-2.0
1032±11.3 306 - 323 6.3K $0.20 / $0.20 N/A 1031.738 [1020.4, 1043.0] 33.23 · 不稳 Apache-2.0

没有找到相关模型