排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1311±31.6 172 - 258 230 N/A N/A 1310.561 [1278.5, 1341.8] 282.05 · 不稳 Llama 3.1
🥈
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1235±40.7 240 - 291 240 N/A N/A 1234.807 [1192.7, 1274.2] 470.80 · 不稳 Llama 3.1
🥉
olmo-7b-instruct Allen AI · Apache-2.0
1072±27.0 306 - 323 741 $0.20 / $0.20 N/A 1071.907 [1043.6, 1097.6] 171.85 · 不稳 Apache-2.0
4
17
molmo-72b-0924 Allen AI · Apache 2.0
1029±44.3 71 - 88 258 N/A N/A 1029.492 [989.6, 1078.1] 457.17 · 不稳 Apache 2.0
5
28
molmo-7b-d-0924 Allen AI · Apache 2.0
976±36.4 76 - 88 233 N/A N/A 976.027 [940.8, 1013.6] 373.50 · 不稳 Apache 2.0

没有找到相关模型