排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1242±34.4 172 - 258 229 N/A N/A 1241.692 [1206.0, 1274.7] 279.27 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1188±35.4 214 - 266 251 $0.05 / $0.20 128K 1188.292 [1152.6, 1223.3] 331.05 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1164±32.3 240 - 291 240 N/A N/A 1164.111 [1132.2, 1196.8] 326.29 · 不稳 Llama 3.1
4
36
molmo-72b-0924 Allen AI · Apache 2.0
1031±35.7 71 - 88 258 N/A N/A 1030.649 [993.0, 1064.4] 353.39 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1001±22.9 306 - 323 742 $0.20 / $0.20 N/A 1000.897 [972.3, 1018.2] 139.15 · 不稳 Apache-2.0
6
50
molmo-7b-d-0924 Allen AI · Apache 2.0
977±28.1 76 - 88 233 N/A N/A 977.321 [954.7, 1010.9] 296.01 · 不稳 Apache 2.0

没有找到相关模型