排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1246±35.8 172 - 258 226 N/A N/A 1245.623 [1209.8, 1281.4] 333.94 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1192±35.7 214 - 266 235 $0.05 / $0.20 128K 1191.542 [1155.8, 1227.3] 332.02 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1172±36.3 240 - 291 238 N/A N/A 1172.451 [1136.2, 1208.7] 342.64 · 不稳 Llama 3.1
4
olmo-7b-instruct Allen AI · Apache-2.0
1012±22.7 306 - 323 732 $0.20 / $0.20 N/A 1011.755 [989.1, 1034.5] 134.11 · 不稳 Apache-2.0
5
59
molmo-72b-0924 Allen AI · Apache 2.0
921±48.2 71 - 88 182 N/A N/A 920.671 [872.5, 968.9] 604.74 · 不稳 Apache 2.0
6
70
molmo-7b-d-0924 Allen AI · Apache 2.0
874±47.1 76 - 88 171 N/A N/A 874.340 [827.2, 921.5] 578.18 · 不稳 Apache 2.0

没有找到相关模型