排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1242±29.8 172 - 258 229 N/A N/A 1242.326 [1213.0, 1272.6] 254.95 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1189±33.0 214 - 266 251 $0.05 / $0.20 128K 1189.218 [1153.2, 1219.3] 289.81 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1165±34.7 240 - 291 240 N/A N/A 1164.795 [1129.6, 1199.0] 322.96 · 不稳 Llama 3.1
4
35
molmo-72b-0924 Allen AI · Apache 2.0
1031±37.2 71 - 88 258 N/A N/A 1030.588 [990.2, 1064.7] 469.93 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1002±19.5 306 - 323 742 $0.20 / $0.20 N/A 1001.516 [977.9, 1017.0] 114.01 · 不稳 Apache-2.0
6
49
molmo-7b-d-0924 Allen AI · Apache 2.0
977±38.2 76 - 88 233 N/A N/A 977.200 [942.2, 1018.7] 447.12 · 不稳 Apache 2.0

没有找到相关模型