排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1314±36.8 172 - 258 226 N/A N/A 1314.351 [1277.1, 1350.7] 387.27 · 不稳 Llama 3.1
🥈
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1231±36.0 240 - 291 237 N/A N/A 1231.448 [1192.9, 1264.9] 388.18 · 不稳 Llama 3.1
🥉
olmo-7b-instruct Allen AI · Apache-2.0
1072±20.3 306 - 323 741 $0.20 / $0.20 N/A 1071.950 [1053.7, 1094.3] 120.35 · 不稳 Apache-2.0
4
16
molmo-72b-0924 Allen AI · Apache 2.0
1029±40.8 71 - 88 258 N/A N/A 1028.611 [981.6, 1063.1] 400.34 · 不稳 Apache 2.0
5
27
molmo-7b-d-0924 Allen AI · Apache 2.0
975±37.6 76 - 88 233 N/A N/A 975.226 [938.5, 1013.7] 464.41 · 不稳 Apache 2.0

没有找到相关模型