排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1308±13.2 72 - 184 2.2K $0.20 / $0.60 65.5K 1307.639 [1294.5, 1320.8] 45.21 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1290±21.6 118 - 220 817 $0.15 / $0.50 65.5K 1289.782 [1268.2, 1311.4] 121.64 · 不稳 Apache 2.0
🥉
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1251±23.5 172 - 258 537 N/A N/A 1251.481 [1228.0, 1275.0] 143.60 · 不稳 Llama 3.1
4
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1251±17.9 111 - 210 1.2K $0.15 / $0.50 65.5K 1250.573 [1232.7, 1268.4] 83.04 · 不稳 Apache 2.0
5
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1221±29.8 214 - 266 363 $0.05 / $0.20 128K 1220.858 [1191.0, 1250.7] 231.72 · 不稳 Apache-2.0
6
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1153±25.6 240 - 291 520 N/A N/A 1153.483 [1127.9, 1179.1] 170.23 · 不稳 Llama 3.1
7
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1085±21.6 273 - 319 827 N/A N/A 1085.306 [1063.7, 1106.9] 121.04 · 不稳 AI2 ImpACT Low-risk
8
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1007±28.1 306 - 323 537 $0.20 / $0.20 N/A 1006.885 [978.8, 1035.0] 205.90 · 不稳 Apache-2.0

没有找到相关模型