排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1252±35.7 172 - 258 229 N/A N/A 1252.487 [1216.8, 1288.2] 331.96 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1199±33.8 214 - 266 248 $0.05 / $0.20 128K 1198.919 [1165.1, 1232.7] 297.05 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1175±36.4 240 - 291 240 N/A N/A 1174.781 [1138.4, 1211.2] 345.45 · 不稳 Llama 3.1
4
56
molmo-72b-0924 Allen AI · Apache 2.0
1022±47.4 71 - 88 184 N/A N/A 1021.997 [974.6, 1069.4] 584.07 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1017±22.4 306 - 323 741 $0.20 / $0.20 N/A 1016.875 [994.5, 1039.2] 130.31 · 不稳 Apache-2.0
6
67
molmo-7b-d-0924 Allen AI · Apache 2.0
975±46.8 76 - 88 171 N/A N/A 974.545 [927.8, 1021.3] 569.07 · 不稳 Apache 2.0

没有找到相关模型