排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1276±11.9 72 - 184 2.7K $0.20 / $0.60 65.5K 1275.656 [1263.7, 1287.6] 37.01 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1270±16.7 118 - 220 1.3K $0.15 / $0.50 65.5K 1269.845 [1253.2, 1286.5] 72.19 · 不稳 Apache 2.0
🥉
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1254±19.4 172 - 258 758 N/A N/A 1254.090 [1234.7, 1273.5] 98.33 · 不稳 Llama 3.1
4
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1250±13.9 111 - 210 1.9K $0.15 / $0.50 65.5K 1250.158 [1236.3, 1264.0] 49.99 · 不稳 Apache 2.0
5
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1203±19.6 214 - 266 872 $0.05 / $0.20 128K 1203.479 [1183.9, 1223.1] 100.02 · 不稳 Apache-2.0
6
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1177±19.6 240 - 291 816 N/A N/A 1177.399 [1157.8, 1197.0] 99.82 · 不稳 Llama 3.1
7
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1123±17.0 273 - 319 1.5K N/A N/A 1123.138 [1106.2, 1140.1] 75.06 · 不稳 AI2 ImpACT Low-risk
8
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1003±18.2 306 - 323 1.5K $0.20 / $0.20 N/A 1002.934 [984.7, 1021.1] 86.08 · 不稳 Apache-2.0

没有找到相关模型