排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1242±35.7 172 - 258 229 N/A N/A 1242.175 [1206.4, 1277.9] 332.33 · 不稳 Llama 3.1
🥈
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1189±33.4 214 - 266 251 $0.05 / $0.20 128K 1189.143 [1155.7, 1222.6] 290.89 · 不稳 Apache-2.0
🥉
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1165±36.5 240 - 291 240 N/A N/A 1164.649 [1128.2, 1201.1] 345.96 · 不稳 Llama 3.1
4
46
molmo-72b-0924 Allen AI · Apache 2.0
1030±40.4 71 - 88 258 N/A N/A 1030.291 [989.9, 1070.7] 425.51 · 不稳 Apache 2.0
5
olmo-7b-instruct Allen AI · Apache-2.0
1006±22.4 306 - 323 742 $0.20 / $0.20 N/A 1006.445 [984.0, 1028.8] 130.61 · 不稳 Apache-2.0
6
59
molmo-7b-d-0924 Allen AI · Apache 2.0
977±40.4 76 - 88 233 N/A N/A 976.944 [936.6, 1017.3] 424.41 · 不稳 Apache 2.0

没有找到相关模型