排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1253±35.7 172 - 258 229 N/A N/A 1253.049 [1217.3, 1288.8] 332.10 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1199±33.8 214 - 266 248 $0.05 / $0.20 128K 1198.769 [1165.0, 1232.5] 296.82 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1175±36.4 240 - 291 240 N/A N/A 1175.420 [1139.0, 1211.9] 345.64 · 不稳 Llama 3.1
4
56
molmo-72b-0924 Allen AI · Apache 2.0
1022±47.7 71 - 88 184 N/A N/A 1022.179 [974.4, 1069.9] 593.36 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1018±22.4 306 - 323 741 $0.20 / $0.20 N/A 1017.546 [995.2, 1039.9] 130.41 · 不稳 Apache-2.0
6
69
molmo-7b-d-0924 Allen AI · Apache 2.0
975±47.1 76 - 88 171 N/A N/A 974.802 [927.7, 1021.9] 577.61 · 不稳 Apache 2.0

没有找到相关模型