排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1247±35.9 172 - 258 226 N/A N/A 1246.643 [1210.8, 1282.5] 334.77 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1192±35.7 214 - 266 235 $0.05 / $0.20 128K 1192.299 [1156.6, 1228.0] 331.39 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1174±36.3 240 - 291 238 N/A N/A 1173.515 [1137.2, 1209.8] 343.47 · 不稳 Llama 3.1
4
olmo-7b-instruct Allen AI · Apache-2.0
1013±22.8 306 - 323 732 $0.20 / $0.20 N/A 1012.765 [989.9, 1035.6] 135.51 · 不稳 Apache-2.0
5
64
molmo-72b-0924 Allen AI · Apache 2.0
921±49.1 71 - 88 182 N/A N/A 921.470 [872.4, 970.6] 627.75 · 不稳 Apache 2.0
6
77
molmo-7b-d-0924 Allen AI · Apache 2.0
875±48.0 76 - 88 171 N/A N/A 875.130 [827.1, 923.2] 600.45 · 不稳 Apache 2.0

没有找到相关模型