排名 模型 得分
🥇
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1312±31.8 172 - 258 229 N/A N/A 1312.010 [1282.3, 1345.8] 273.75 · 不稳 Llama 3.1
🥈
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1235±39.4 240 - 291 240 N/A N/A 1234.559 [1195.4, 1274.3] 353.57 · 不稳 Llama 3.1
🥉
olmo-7b-instruct Allen AI · Apache-2.0
1072±19.9 306 - 323 741 $0.20 / $0.20 N/A 1071.952 [1052.4, 1092.1] 115.34 · 不稳 Apache-2.0
4
18
molmo-72b-0924 Allen AI · Apache 2.0
1030±36.6 71 - 88 258 N/A N/A 1029.740 [991.5, 1064.7] 416.34 · 不稳 Apache 2.0
5
29
molmo-7b-d-0924 Allen AI · Apache 2.0
976±32.3 76 - 88 233 N/A N/A 976.307 [940.1, 1004.7] 322.59 · 不稳 Apache 2.0

没有找到相关模型