排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1253±35.7 172 - 258 229 N/A N/A 1253.057 [1217.3, 1288.8] 332.09 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1199±33.8 214 - 266 248 $0.05 / $0.20 128K 1198.699 [1164.9, 1232.5] 296.87 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1175±36.4 240 - 291 240 N/A N/A 1175.434 [1139.0, 1211.9] 345.63 · 不稳 Llama 3.1
4
56
molmo-72b-0924 Allen AI · Apache 2.0
1022±47.7 71 - 88 184 N/A N/A 1022.264 [974.5, 1070.0] 593.23 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1018±22.4 306 - 323 741 $0.20 / $0.20 N/A 1017.586 [995.2, 1040.0] 130.40 · 不稳 Apache-2.0
6
69
molmo-7b-d-0924 Allen AI · Apache 2.0
975±47.1 76 - 88 171 N/A N/A 974.858 [927.8, 1022.0] 577.53 · 不稳 Apache 2.0

没有找到相关模型