排名 模型 得分
🥇
175.0
olmo-3.1-32b-instruct Allen AI · Apache 2.0
1331±6.0 72 - 184 12.2K $0.20 / $0.60 65.5K 1331.000 [1325.0, 1337.0] 9.37 · 波动 Apache 2.0
🥈
178.0
molmo-2-8b Allen AI · Apache 2.0
1327±21.0 143 - 242 804 $0.20 / $0.20 36.9K 1327.000 [1306.0, 1348.0] 114.80 · 不稳 Apache 2.0
🥉
209.0
olmo-3-32b-think Allen AI · Apache 2.0
1305±8.0 118 - 220 6.0K $0.15 / $0.50 65.5K 1305.000 [1297.0, 1313.0] 16.66 · 不稳 Apache 2.0
4
224.0
llama-3.1-tulu-3-70b Allen AI · Llama 3.1
1286±10.0 172 - 258 2.8K N/A N/A 1286.000 [1276.0, 1296.0] 26.03 · 不稳 Llama 3.1
5
226.0
olmo-3.1-32b-think Allen AI · Apache 2.0
1286±7.0 111 - 210 8.5K $0.15 / $0.50 65.5K 1286.000 [1279.0, 1293.0] 12.76 · 不稳 Apache 2.0
6
247.0
olmo-2-0325-32b-instruct Allen AI · Apache-2.0
1251±11.0 214 - 266 3.3K $0.05 / $0.20 128K 1251.000 [1240.0, 1262.0] 31.50 · 不稳 Apache-2.0
7
266.0
llama-3.1-tulu-3-8b Allen AI · Llama 3.1
1221±11.0 240 - 291 2.9K N/A N/A 1221.000 [1210.0, 1232.0] 31.50 · 不稳 Llama 3.1
8
288.0
tulu-2-dpo-70b Allen AI · AI2 ImpACT Low-risk
1177±10.0 273 - 319 6.5K N/A N/A 1177.000 [1167.0, 1187.0] 26.03 · 不稳 AI2 ImpACT Low-risk
9
329.0
olmo-7b-instruct Allen AI · Apache-2.0
1074±11.0 306 - 323 6.3K $0.20 / $0.20 N/A 1074.000 [1063.0, 1085.0] 31.50 · 不稳 Apache-2.0

没有找到相关模型