排名 模型 得分
🥇
168.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1323±8.0 72 - 184 6.5K $0.20 / $0.60 65.5K 1322.947 [1315.0, 1330.9] 16.47 · 不稳 Apache 2.0
🥈
177.0
olmo-3-32b-think Allen AI · Apache 2.0
1302±11.2 118 - 220 3.0K $0.15 / $0.50 65.5K 1302.182 [1291.0, 1313.4] 32.53 · 不稳 Apache 2.0
🥉
180.0
molmo-2-8b Allen AI · Apache 2.0
1294±28.6 143 - 242 438 $0.20 / $0.20 36.9K 1293.558 [1265.0, 1322.1] 212.60 · 不稳 Apache 2.0
4
206.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1273±9.6 111 - 210 4.4K $0.15 / $0.50 65.5K 1272.613 [1263.0, 1282.2] 23.89 · 不稳 Apache 2.0
5
217.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1220±18.8 172 - 258 779 N/A N/A 1220.204 [1201.4, 1239.0] 92.34 · 不稳 Llama 3.1
6
238.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1208±20.1 214 - 266 789 $0.05 / $0.20 128K 1207.680 [1187.6, 1227.8] 105.43 · 不稳 Apache-2.0
7
247.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1174±20.0 240 - 291 728 N/A N/A 1174.444 [1154.4, 1194.5] 104.46 · 不稳 Llama 3.1
8
280.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1105±16.6 273 - 319 1.4K N/A N/A 1104.583 [1088.0, 1121.1] 71.37 · 不稳 AI2 ImpACT Low-risk
9
322.0
olmo-7b-instruct Allen AI · Apache-2.0
993±17.2 306 - 323 1.5K $0.20 / $0.20 N/A 992.993 [975.8, 1010.2] 76.73 · 不稳 Apache-2.0

没有找到相关模型