排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1246±35.8 172 - 258 226 N/A N/A 1245.859 [1210.0, 1281.7] 334.01 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1191±35.7 214 - 266 235 $0.05 / $0.20 128K 1191.445 [1155.7, 1227.1] 331.75 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1173±36.3 240 - 291 238 N/A N/A 1172.730 [1136.4, 1209.0] 342.70 · 不稳 Llama 3.1
4
olmo-7b-instruct Allen AI · Apache-2.0
1012±22.7 306 - 323 732 $0.20 / $0.20 N/A 1011.939 [989.2, 1034.7] 134.30 · 不稳 Apache-2.0
5
61
molmo-72b-0924 Allen AI · Apache 2.0
924±48.3 71 - 88 182 N/A N/A 924.100 [875.8, 972.4] 608.13 · 不稳 Apache 2.0
6
72
molmo-7b-d-0924 Allen AI · Apache 2.0
878±47.3 76 - 88 171 N/A N/A 877.777 [830.5, 925.0] 581.43 · 不稳 Apache 2.0

没有找到相关模型