排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1251±9.1 72 - 184 8.7K $0.20 / $0.60 65.5K 1251.003 [1241.9, 1260.1] 21.49 · 不稳 Apache 2.0
🥈
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1237±12.1 118 - 220 4.3K $0.15 / $0.50 65.5K 1236.992 [1224.9, 1249.1] 38.22 · 不稳 Apache 2.0
🥉
178.0
molmo-2-8b Allen AI · Apache 2.0
1228±32.6 143 - 242 583 $0.20 / $0.20 36.9K 1227.683 [1195.1, 1260.3] 276.21 · 不稳 Apache 2.0
4
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1189±11.3 111 - 210 6.1K $0.15 / $0.50 65.5K 1188.581 [1177.3, 1199.9] 33.30 · 不稳 Apache 2.0
5
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1170±17.7 172 - 258 1.7K N/A N/A 1170.020 [1152.4, 1187.7] 81.12 · 不稳 Llama 3.1
6
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1107±17.3 214 - 266 2.3K $0.05 / $0.20 128K 1106.939 [1089.6, 1124.3] 78.28 · 不稳 Apache-2.0
7
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1060±19.2 240 - 291 1.8K N/A N/A 1060.223 [1041.0, 1079.4] 96.11 · 不稳 Llama 3.1
8
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
963±14.2 273 - 319 4.4K N/A N/A 963.040 [948.9, 977.2] 52.23 · 不稳 AI2 ImpACT Low-risk
9
329.0
olmo-7b-instruct Allen AI · Apache-2.0
828±17.7 306 - 323 4.3K $0.20 / $0.20 N/A 827.524 [809.8, 845.2] 81.49 · 不稳 Apache-2.0

没有找到相关模型