排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1243±35.7 172 - 258 229 N/A N/A 1242.700 [1207.0, 1278.4] 332.55 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1189±33.4 214 - 266 251 $0.05 / $0.20 128K 1189.397 [1156.0, 1222.8] 290.50 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1165±36.5 240 - 291 240 N/A N/A 1165.219 [1128.8, 1201.7] 346.21 · 不稳 Llama 3.1
4
54
molmo-72b-0924 Allen AI · Apache 2.0
1030±40.6 71 - 88 258 N/A N/A 1030.267 [989.7, 1070.9] 428.98 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1007±22.4 306 - 323 742 $0.20 / $0.20 N/A 1006.978 [984.5, 1029.4] 131.12 · 不稳 Apache-2.0
6
67
molmo-7b-d-0924 Allen AI · Apache 2.0
977±40.5 76 - 88 233 N/A N/A 976.995 [936.5, 1017.5] 427.65 · 不稳 Apache 2.0

没有找到相关模型