排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1253±35.7 172 - 258 229 N/A N/A 1253.089 [1217.4, 1288.8] 331.93 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1199±33.8 214 - 266 248 $0.05 / $0.20 128K 1198.721 [1164.9, 1232.5] 297.22 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1175±36.4 240 - 291 240 N/A N/A 1175.405 [1139.0, 1211.8] 345.51 · 不稳 Llama 3.1
4
56
molmo-72b-0924 Allen AI · Apache 2.0
1022±47.3 71 - 88 184 N/A N/A 1022.154 [974.8, 1069.5] 582.53 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1018±22.4 306 - 323 741 $0.20 / $0.20 N/A 1017.635 [995.3, 1040.0] 130.19 · 不稳 Apache-2.0
6
69
molmo-7b-d-0924 Allen AI · Apache 2.0
975±46.7 76 - 88 171 N/A N/A 974.712 [928.0, 1021.4] 567.31 · 不稳 Apache 2.0

没有找到相关模型