Leaderboard | Coding

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1596

Claude Opus 4.6

1594

Claude Sonnet 4.6

1594

GPT-5.4

1566

Claude Opus 4.6 (Thinking)

1506

Claude Sonnet 4.6 (Thinking)

1446

Claude Opus 4.5 (Thinking)

1418

Gemini 3.1 Pro

1409

Claude Opus 4.5

1381

GPT-5.3 Codex (High)

1362

Claude Sonnet 4.5 (Thinking)

1358

GPT-5.2 Instant

1353

Claude Haiku 4.5 (Extended Thinking)

1340

GPT-5.2

1337

Gemini 3 Pro

1324

GLM 5

Last updated about 1 month ago

Rank	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
1	Claude Opus 4.6	1596	±6	21.6K	1.1%	2.1%	48 tps	1.7s	200K	$5.00	$25.00
2	Claude Sonnet 4.6	1594	±10	15.7K	1.4%	1.6%	47 tps	1.2s	200K	$3.00	$15.00
3	GPT-5.4	1594	±14	4.4K	1.6%	2.6%	55 tps	0.8s	1M	$2.50	$15.00
4	Claude Opus 4.6 (Thinking)	1566	±8	16.5K	1.6%	2.5%	56 tps	1.6s	200K	$5.00	$25.00
5	Claude Sonnet 4.6 (Thinking)	1506	±8	16.2K	3.5%	4.7%	57 tps	1.1s	200K	$3.00	$15.00
6	Claude Opus 4.5 (Thinking)	1446	±4	60.8K	1.9%	1.8%	49 tps	1.4s	200K	$5.00	$25.00
7	Gemini 3.1 Pro	1418	±9	22K	2.5%	3.5%	35 tps	4.1s	1M	$2.00	$12.00
8	Claude Opus 4.5	1409	±5	15.1K	2.2%	1.5%	45 tps	1.5s	200K	$5.00	$25.00
9	GPT-5.3 Codex (High)	1381	±9	3.2K	1.2%	2.0%	61 tps	17.8s	400K	$1.75	$14.00
10	Claude Sonnet 4.5 (Thinking)	1362	±4	58.2K	3.3%	1.9%	44 tps	1.1s	200K	$3.00	$15.00
11	GPT-5.2 Instant	1358	±6	15.7K	3.3%	1.7%	52 tps	2.0s	400K	$1.75	$14.00
12	Claude Haiku 4.5 (Extended Thinking)	1353	±4	14.3K	3.8%	1.4%	115 tps	0.7s	200K	$1.00	$5.00
13	GPT-5.2	1340	±8	11.3K	3.2%	4.1%	18 tps	2.7s	400K	$1.75	$14.00
14	Gemini 3 Pro	1337	±5	59.4K	2.6%	2.1%	50 tps	3.6s	1M	$2.00	$12.00
15	GLM 5	1324	±14	11.7K	3.3%	3.4%	36 tps	2.7s	200K	$0.72	$2.55
16	GPT-5.1	1319	±7	12.9K	3.4%	2.3%	71 tps	1.4s	400K	$1.42	$11.33
17	Claude Sonnet 4.5	1307	±3	20.9K	5.0%	1.4%	41 tps	1.3s	200K	$1.80	$9.00
18	GPT-5.2 (High)	1297	±8	30.7K	2.8%	6.7%	18 tps	16.3s	400K	$1.75	$14.00
19	Kimi K2.5	1291	±11	16.5K	3.4%	6.5%	33 tps	1.7s	262K	$0.34	$2.57
20	Gemini 3 Pro (Low)	1291	±6	11.9K	4.2%	2.4%	51 tps	3.5s	1M	$2.00	$12.00
21	GPT-5.1 (High)	1290	±6	19.1K	3.5%	3.2%	76 tps	6.9s	400K	$1.25	$10.00
22	Gemini 3 Flash Preview Thinking	1286	±6	32.7K	3.3%	1.6%	3 tps	6.2s	1M	$0.50	$3.00
23	Claude Haiku 4.5	1283	±3	16.4K	4.5%	1.1%	100 tps	0.9s	200K	$1.00	$5.00
24	MiniMax M2.5	1283	±28	510	3.8%	1.4%	70 tps	1.9s	205K	$0.28	$1.20
25	GPT-5.3 Codex (Medium)	1278	±27	1.1K	2.3%	2.3%	62 tps	10.3s	400K	$1.75	$14.00
26	GPT-5.3 Instant	1271	±12	4.2K	2.5%	0.9%	63 tps	0.8s	400K	$1.75	$14.00
27	Claude Sonnet 4 (Thinking)	1261	±3	25.9K	2.9%	1.5%	52 tps	1.5s	200K	$3.00	$13.67
28	GPT-5 Codex (High)	1260	±7	18.5K	3.3%	3.2%	122 tps	7.1s	400K	$1.25	$10.00
29	GPT-5 (High)	1259	±4	16.2K	3.5%	4.5%	81 tps	35.9s	400K	$1.25	$10.00
30	GPT-5.2 Codex (High)	1257	±12	3.1K	2.8%	8.8%	41 tps	12.9s	400K	$1.75	$14.00
31	GPT-5.1 Codex (High)	1240	±8	37K	3.3%	3.2%	96 tps	3.9s	400K	$1.25	$10.00
32	Grok 4.1 Fast Non-Reasoning	1239	±6	9.4K	5.4%	0.9%	101 tps	0.5s	2M	$0.20	$0.50
33	GPT-5 Chat	1231	±4	35K	4.5%	1.3%	95 tps	0.9s	400K	$1.25	$10.00
34	Qwen3 Next 80B A3B Instruct	1231	±5	8.8K	5.8%	0.6%	84 tps	1.1s	256K	$0.20	$1.42
35	MiniMax M2.5 Lightning	1228	±14	1.7K	3.2%	1.5%	51 tps	2.0s	205K	$0.60	$2.40
36	GPT-5.2 (Extra High)	1221	±9	8K	3.5%	13.2%	17 tps	20.5s	400K	$1.75	$14.00
37	Qwen3 VL 235B A22B Instruct	1220	±7	5.6K	6.7%	3.1%	75 tps	1.9s	129K	$0.37	$1.81
38	Qwen3.5 122B A17B	1216	±15	1.9K	3.1%	1.5%	82 tps	1.4s	256K	$0.40	$3.20
39	GPT-5 Codex (Medium)	1214	±6	8.8K	3.9%	4.1%	122 tps	5.2s	400K	$1.25	$10.00
40	GPT-5.2 Codex (Medium)	1211	±12	2.4K	3.0%	5.7%	37 tps	6.3s	400K	$1.75	$14.00
41	Qwen3.5 27B	1211	±16	910	4.7%	3.7%	55 tps	2.6s	256K	$0.30	$2.40
42	Kimi K2.5 Instant	1210	±8	1.8K	3.2%	2.9%	32 tps	3.0s	262K	$0.50	$3.00
43	Claude Sonnet 4	1205	±3	43.2K	3.7%	1.8%	49 tps	1.3s	200K	$3.00	$15.00
44	Gemini 3 Flash Preview	1205	±11	7.2K	3.7%	1.3%	138 tps	1.4s	1M	$0.50	$3.00
45	Gemini 2.5 Pro High	1204	±3	21.1K	5.7%	1.5%	48 tps	2.3s	1M	$1.25	$10.00
46	Qwen3 Max Instruct Preview	1203	±6	16.1K	4.6%	1.1%	31 tps	1.7s	256K	$1.43	$6.61
47	GPT-5.1 Codex Max	1200	±12	6.4K	3.9%	3.0%	118 tps	4.1s	400K	$1.25	$10.00
48	MiniMax M2.1 Lightning	1197	±23	875	3.3%	1.7%	52 tps	2.1s	205K	$0.30	$2.40
49	Qwen3 30B A3B Instruct 2507	1194	±5	12.7K	5.7%	1.2%	55 tps	1.3s	131K	$0.13	$0.72
50	Kimi K2 Thinking Turbo	1192	±6	20.3K	3.4%	2.0%	75 tps	1.4s	262K	$1.15	$8.00
51	MiniMax M2.1	1192	±8	19.4K	3.6%	2.1%	66 tps	2.6s	205K	$0.30	$1.20
52	DeepSeek V3.2	1189	±8	5.1K	4.7%	1.4%	83 tps	5.1s	131K	$0.43	$1.09
53	MiniMax M2.5 FP8	1185	±17	610	3.2%	3.6%	33 tps	1.7s	205K	$0.45	$1.75
54	GPT-5	1185	±4	21.3K	5.3%	3.1%	78 tps	23.1s	400K	$1.25	$9.67
55	Grok 4 Fast Non-Reasoning	1185	±5	8.1K	7.1%	1.5%	93 tps	0.6s	2M	$0.27	$0.67
56	MiniMax M2	1183	±5	19.7K	4.2%	2.2%	39 tps	2.3s	205K	$0.21	$0.85
57	Nova Experimental Chat 12-10	1182	±9	2.9K	3.8%	2.4%	84 tps	12.9s	98K	$0	$0
58	GLM 4.6	1182	±7	17.2K	4.4%	5.4%	39 tps	1.5s	200K	$0.42	$1.66
59	GPT-5.3 Codex (Low)	1178	±28	510	1.0%	1.8%	61 tps	4.3s	400K	$1.75	$14.00
60	Grok 4.1 Fast Reasoning	1178	±7	39.5K	4.4%	1.5%	58 tps	7.3s	2M	$0.20	$0.50
61	DeepSeek V3.2 Thinking	1178	±9	23.3K	4.0%	9.0%	30 tps	2.6s	131K	$0.28	$0.42
62	Grok 4 Fast Reasoning	1177	±3	14.5K	5.0%	2.1%	102 tps	3.1s	2M	$0.30	$0.75
63	Gemini 2.5 Pro	1176	±3	37.9K	4.8%	2.3%	45 tps	2.6s	1M	$1.25	$10.00
64	Qwen3 235B A22B Instruct 2507	1172	±4	12.6K	6.4%	6.8%	13 tps	1.9s	262K	$0.13	$0.52
65	Claude Sonnet 3.5 v2	1171	±6	5.5K	3.4%	<0.1%	46 tps	1.4s	200K	$3.00	$15.00
66	GPT-5.1 Codex (Medium)	1171	±14	3K	3.2%	4.6%	71 tps	3.7s	400K	$1.25	$10.00
67	GPT-5.1 Instant	1171	±8	8.3K	4.1%	1.3%	50 tps	1.9s	400K	$1.25	$10.00
68	Grok 4.20 Beta Reasoning	1167	±22	1.2K	4.1%	1.1%	77 tps	4.5s	2M	$2.00	$5.50
69	gpt-oss-120b	1165	±5	19.2K	5.0%	0.7%	213 tps	0.5s	131K	$0.11	$0.50
70	Qwen3.5 35B A3B	1164	±25	865	3.9%	2.1%	116 tps	2.1s	256K	$0.63	$1.13
71	GPT-5 Codex (Low)	1163	±10	5K	4.1%	2.7%	112 tps	3.5s	400K	$1.25	$10.00
72	GLM 4.7	1161	±7	16.8K	3.7%	5.8%	40 tps	1.5s	200K	$0.77	$1.73
73	DeepSeek V3.1 Terminus Chat	1158	±5	6.5K	6.9%	3.4%	27 tps	1.5s	131K	$0.86	$1.80
74	Qwen Plus (Aug'24)	1146	±5	17.2K	4.7%	1.4%	53 tps	1.3s	30K	$0.40	$1.20
75	Qwen3.5 397B A17B	1142	±14	2.5K	2.9%	4.3%	57 tps	1.4s	256K	$0.52	$3.00
76	Gemini 2.5 Flash Preview 0925	1140	±6	7.6K	6.0%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
77	Mistral Large 3	1131	±8	5.4K	5.8%	2.1%	51 tps	1.0s	256K	$0.50	$1.50
78	GPT-5 Mini	1131	±5	8.6K	5.4%	2.6%	66 tps	14.2s	400K	$0.25	$2.00
79	DeepSeek V3.1 Turbo	1130	±7	4.8K	5.3%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
80	Grok 4.20 Multi Agent Beta	1129	±19	945	3.6%	1.2%	56 tps	8.8s	2M	$2.00	$6.00
81	Qwen3 Max Thinking Preview	1127	±10	6.3K	5.7%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
82	Grok 4	1125	±3	39.6K	4.4%	3.9%	29 tps	11.1s	256K	$3.00	$15.00
83	GPT-4.1	1123	±5	32.8K	5.2%	3.7%	112 tps	1.3s	1M	$2.00	$8.00
84	Gemini 2.5 Flash Lite Preview 0925	1122	±7	8.5K	6.6%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
85	Gemini 2.5 Flash Thinking	1118	±4	13.7K	3.6%	2.2%	88 tps	6.4s	1M	$0.30	$2.50
86	GPT-5 Mini Minimal	1114	±12	3.2K	8.5%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
87	GPT-5.2 Codex (Low)	1113	±19	1.2K	3.2%	4.5%	41 tps	5.0s	400K	$1.75	$14.00
88	DeepSeek V3.1 Chat	1110	±7	4.9K	6.6%	2.8%	21 tps	1.6s	131K	$0.38	$1.00
89	Qwen3 Omni 30B A3B Thinking	1110	±10	2.3K	6.0%	3.7%	67 tps	1.2s	66K	$0.97	$1.79
90	DeepSeek V3.2 Exp Chat	1107	±4	5.5K	6.1%	2.6%	29 tps	1.5s	131K	$0.27	$0.39
91	Qwen Max	1107	±4	18.3K	4.2%	1.5%	49 tps	1.5s	33K	$1.60	$6.40
92	Gemini 2.5 Flash Lite	1103	±5	21.3K	6.2%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
93	Grok 3 Fast	1102	±14	2.5K	4.7%	1.7%	52 tps	2.4s	131K	$5.00	$25.00
94	GPT-4o	1102	±5	8.5K	3.7%	1.0%	49 tps	2.4s	128K	$3.71	$12.57
95	Step 3.5 Flash	1102	±24	810	3.6%	2.2%	109 tps	0.6s	256K	$0.05	$0.15
96	DeepSeek V3 0324	1100	±4	15.1K	4.3%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
97	Qwen3 Coder 480B A35B Instruct	1099	±8	3.1K	4.5%	3.3%	61 tps	2.0s	262K	$0.71	$1.34
98	Gemini 2.5 Flash	1098	±4	35.9K	3.2%	1.3%	2 tps	3.7s	1M	$0.30	$2.50
99	Grok 3	1098	±4	19.1K	5.5%	1.5%	53 tps	0.6s	1M	$3.67	$18.33
100	DeepSeek V3 0324 Turbo	1093	±5	15.5K	5.7%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
101	Qwen3 235B A22B	1093	±6	4.5K	8.0%	5.3%	71 tps	0.9s	41K	$0.23	$0.63
102	OpenAI o3-pro	1090	±8	5.4K	4.3%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
103	DeepSeek V3.1	1089	±12	2.3K	4.7%	0.8%	197 tps	0.4s	164K	$0.55	$1.60
104	DeepSeek V3.2 Exp Thinking	1089	±7	5.9K	3.5%	7.2%	26 tps	3.0s	131K	$0.28	$0.42
105	GPT-4.1 mini	1087	±5	19.7K	4.2%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
106	GPT-4.1 nano	1085	±5	17K	5.0%	0.6%	175 tps	0.5s	1M	$0.10	$0.40
107	Qwen3 Omni 30B A3B Instruct	1085	±13	775	4.3%	3.9%	65 tps	1.2s	66K	$0.35	$0.97
108	DeepSeek V3 (Turbo)	1082	±20	1.5K	5.1%	1.5%	32 tps	1.5s	64K	$0.40	$1.30
109	Seed 1.8 251228	1081	±10	3.2K	3.1%	3.7%	41 tps	2.1s	256K	$0.25	$2.00
110	Mistral Medium	1080	±4	9.6K	5.6%	1.8%	48 tps	0.6s	33K	$1.48	$4.55
111	Qwen3 Max Thinking	1080	±18	1.5K	2.0%	13.5%	32 tps	2.3s	256K	$1.20	$6.00
112	GLM 4.5	1075	±5	6K	7.0%	3.7%	46 tps	1.4s	131K	$0.43	$1.63
113	Kimi K2 0905	1074	±7	8.7K	4.3%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
114	Kimi K2 Fast	1073	±5	35K	6.4%	0.8%	365 tps	0.5s	131K	$1.00	$3.00
115	GPT-5 (Low)	1070	±14	690	3.5%	1.8%	75 tps	8.2s	400K	$1.25	$10.00
116	Kimi K2 0905 Turbo	1070	±6	7.5K	9.1%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
117	gpt-oss-20b	1066	±6	7.7K	7.1%	0.5%	216 tps	0.5s	131K	$0.06	$0.26
118	Grok 4.20 Beta Non-reasoning	1063	±36	500	4.8%	1.1%	151 tps	0.6s	2M	$2.00	$6.00
119	OpenAI o1	1062	±6	9.9K	3.3%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
120	DeepSeek V3.1 Terminus Thinking	1061	±9	2.9K	9.4%	5.9%	27 tps	1.8s	131K	$0.56	$1.68
121	OpenAI o1-pro	1061	±20	680	7.5%	5.2%	33 tps	72.8s	200K	$150.00	$600.00
122	Gemini 2.5 Flash Lite Thinking	1061	±4	9.8K	6.2%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
123	Seed 2.0 Lite (Medium)	1058	±20	525	3.7%	6.6%	33 tps	1.6s	256K	$0.25	$2.00
124	LongCat Flash Chat	1058	±12	2.7K	5.9%	0.8%	85 tps	0.9s	131K	$0.14	$0.68
125	GPT-5.1 Codex Mini (Medium)	1057	±15	1.9K	4.9%	4.6%	69 tps	4.1s	400K	$0.25	$2.00
126	GPT-5.1 Codex Mini (High)	1054	±15	2.2K	3.9%	5.9%	70 tps	4.6s	400K	$0.25	$2.00
127	Qwen3 32B Fast	1052	±6	11.4K	5.2%	11.6%	30 tps	3.1s	41K	$0.10	$0.25
128	ERNIE 4.5 300B A47B	1049	±4	13.5K	3.9%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
129	Cogito v2.1 671B	1044	±19	1.2K	4.6%	0.8%	85 tps	0.5s	128K	$1.25	$1.25
130	Qwen3 32B	1044	±19	850	6.6%	3.9%	30 tps	3.1s	41K	$0.12	$0.42
131	GLM 4.5 AirX	1042	±15	1.1K	6.9%	3.3%	75 tps	1.2s	131K	$1.10	$4.50
132	Kimi K2 Thinking	1042	±10	3.3K	5.1%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
133	OpenAI o4-mini	1042	±5	8.5K	6.4%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
134	Gemini 3.1 Flash Lite Preview Thinking	1039	±16	1.4K	4.2%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
135	QwQ 32B	1035	±4	11.6K	6.4%	5.4%	41 tps	2.1s	16K	$0.43	$0.56
136	Qwen3 Next 80B A3B Thinking	1035	±5	6.2K	7.4%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
137	Gemini 2.5 Flash Lite Thinking Preview 0925	1035	±7	5.8K	6.8%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
138	Gemini 3.1 Flash Lite Preview	1034	±21	980	4.4%	1.0%	8 tps	1.2s	1M	$0.25	$1.50
139	Qwen3 VL 30B A3B Instruct	1034	±15	1K	6.7%	1.8%	80 tps	2.6s	129K	$0.18	$0.67
140	DeepSeek V3	1032	±5	17.6K	3.7%	0.9%	69 tps	1.1s	64K	$0.59	$1.49
141	DeepSeek V3.2 Speciale	1030	±10	2.3K	6.1%	6.0%	43 tps	1.4s	131K	$0.84	$1.52
142	Gemini 2.0 Flash Lite	1029	±5	14.7K	9.5%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
143	Amazon Nova 2 Lite	1026	±10	3.6K	6.0%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
144	Command A	1024	±4	22.4K	4.8%	2.2%	42 tps	0.8s	256K	$2.00	$7.33
145	DeepSeek V3.1 Nex N1	1021	±19	565	5.0%	3.4%	24 tps	7.2s	131K	$0.14	$0.50
146	OpenAI o3	1020	±7	5.9K	4.0%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
147	Gemini 2.0 Flash	1018	±7	8.2K	3.8%	<0.1%	76 tps	0.5s	1M	$0.14	$0.56
148	Nemotron 3 Nano (Thinking)	1012	±13	2K	6.7%	2.0%	200 tps	0.5s	256K	$0	$0
149	Qwen3 VL 235B A22B Thinking	1009	±6	4.6K	8.3%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
150	Qwen3 Coder Plus	1007	±22	610	4.7%	5.1%	56 tps	2.3s	128K	$1.80	$9.80
151	DeepSeek-R1 Turbo	1003	±9	2.5K	5.6%	2.6%	29 tps	1.8s	64K	$2.85	$4.75
152	Qwen 2.5 VL 32B Instruct	1001	±21	865	4.9%	6.3%	43 tps	3.2s	128K	$0.35	$0.62
153	Qwen3 235B A22B Thinking 2507	1000	±10	2.8K	4.4%	2.5%	53 tps	1.6s	131K	$0.59	$5.70
154	OpenAI o3-mini-high	999	±5	8.3K	4.1%	2.4%	231 tps	10.5s	200K	$1.10	$4.40
155	OpenAI o3-mini	999	±4	15K	5.5%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
156	OpenAI o4-mini-high	995	±7	13.6K	6.2%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
157	Seed 1.6 250615	995	±21	1.6K	6.0%	3.1%	46 tps	2.2s	256K	$0.25	$2.00
158	Qwen3 30B A3B	994	±8	6.3K	6.9%	5.1%	163 tps	1.0s	41K	$0.06	$0.21
159	GPT-5 Nano	989	±6	4.6K	8.0%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
160	OpenAI o3-mini-low	988	±6	12.2K	6.4%	0.7%	139 tps	1.5s	200K	$1.10	$4.40
161	Grok Code Fast 1	987	±9	2.5K	6.0%	5.9%	294 tps	0.5s	256K	$0.20	$1.50
162	GLM 4.6V	986	±8	3K	5.5%	6.4%	21 tps	1.8s	128K	$0.38	$0.90
163	Kimi K2 0711	981	±6	7K	4.5%	1.6%	29 tps	1.3s	131K	$0.72	$2.60
164	Seed 2.0 Mini (Medium)	981	±35	570	5.8%	11.9%	33 tps	1.7s	256K	$0.15	$0.60
165	Mistral Small 3.1 24B Instruct	980	±11	2.9K	4.3%	7.5%	15 tps	2.4s	131K	$0.06	$0.18
166	DeepSeek-R1 0528	979	±6	5.5K	3.5%	1.3%	93 tps	0.5s	64K	$1.60	$3.67
167	DeepSeek V3.1 Thinking	976	±9	5.2K	9.5%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
168	Nemotron 3 Nano	974	±46	580	6.5%	1.3%	216 tps	0.8s	256K	$0.05	$4.94
169	Qwen 2.5 32B Instruct	972	±7	4.1K	6.5%	2.5%	48 tps	1.0s	131K	$0.21	$0.25
170	Llama 4 Maverick	971	±5	21K	5.0%	1.2%	88 tps	2.4s	1M	$0.23	$0.83
171	Mistral Small 3.2 24B	970	±13	4.6K	4.9%	2.8%	141 tps	0.7s	33K	$0.02	$0.08
172	Pixtral Large	969	±14	3.5K	3.9%	2.5%	57 tps	1.3s	128K	$1.50	$4.50
173	Qwen3 VL 30B A3B Thinking	967	±11	1.9K	8.9%	4.5%	84 tps	2.9s	127K	$0.20	$1.47
174	Llama 4 Scout	965	±5	17.5K	5.3%	0.6%	88 tps	5.1s	131K	$0.18	$0.46
175	Devstral Medium	962	±11	3.5K	5.2%	1.5%	77 tps	0.6s	131K	$0.40	$2.00
176	Qwen3 14B	962	±8	5.3K	8.4%	1.7%	109 tps	0.8s	41K	$0.04	$0.15
177	Qwen 2.5 72B	960	±15	1.4K	4.5%	1.2%	96 tps	1.2s	131K	$0.14	$0.26
178	Llama 3.1 8B Turbo	958	±14	2.2K	2.0%	2.1%	650 tps	0.5s	128K	$0.13	$0.14
179	Qwen3 30B A3B Thinking 2507	953	±10	3.5K	4.7%	0.5%	124 tps	1.2s	131K	$0.16	$1.70
180	Switchpoint Router	949	±10	2.7K	3.6%	1.7%	71 tps	4.9s	131K	$0.85	$3.40
181	Qwen3 8B	948	±9	4.2K	8.2%	2.4%	61 tps	1.4s	41K	$0.02	$0.07
182	Ministral 14B 3.0	948	±16	805	8.5%	2.0%	119 tps	0.5s	128K	$0.20	$0.20
183	Grok 3 Mini Fast	943	±7	9K	7.0%	1.6%	44 tps	0.5s	131K	$0.60	$4.00
184	ERNIE 4.5 21B A3B	943	±28	540	6.9%	2.3%	78 tps	1.5s	120K	$0.05	$0.19
185	ERNIE 4.5 VL 424B A47B	942	±18	725	6.5%	4.9%	36 tps	3.5s	123K	$0.42	$1.25
186	NVIDIA Llama 3.3 Nemotron Super 49B v1.5	941	±19	1.4K	6.9%	2.0%	50 tps	0.6s	131K	$0.09	$0.33
187	DeepSeek-R1	939	±6	6.4K	4.3%	0.8%	133 tps	0.6s	64K	$0.91	$3.07
188	DeepSeek Prover v2	935	±10	1.3K	3.0%	5.2%	14 tps	1.3s	164K	$0.40	$1.56
189	Llama 3.3 70B	933	±10	3K	6.6%	0.3%	500 tps	0.5s	8K	$0.48	$0.66
190	Codestral	931	±19	855	6.0%	5.2%	151 tps	0.9s	262K	$0.15	$0.45
191	Grok 3 Mini	927	±6	9.9K	6.4%	1.2%	43 tps	0.5s	131K	$0.30	$0.50
192	Mistral Small 3.1	925	±14	2.4K	4.0%	7.4%	13 tps	2.6s	32K	$0.17	$0.28
193	Jamba 1.6 Large	924	±9	3.3K	3.8%	2.0%	59 tps	1.2s	256K	$1.33	$5.33
194	Llama 3.3 Swallow 70B Instruct	919	±8	3.5K	5.5%	1.4%	153 tps	1.3s	131K	$0.13	$0.39
195	Open Mistral Nemo	918	±21	1.7K	4.5%	1.5%	171 tps	0.5s	131K	$0.15	$0.15
196	Jamba 1.7 Large	917	±16	975	8.0%	1.3%	58 tps	1.0s	256K	$1.33	$5.33
197	Devstral Small	916	±17	1.4K	5.0%	2.4%	180 tps	0.6s	131K	$0.10	$0.30
198	Rnj-1 Instruct	915	±21	970	6.7%	0.6%	103 tps	0.3s	33K	$0.15	$0.15
199	Seed 1.6 Flash 250715	913	±16	1.2K	5.7%	2.5%	108 tps	1.6s	256K	$0.07	$0.30
200	Inception Mercury Coder Small Beta	912	±20	610	3.2%	1.7%	270 tps	1.4s	32K	$0.25	$1.00
201	Magistral Small 2506	908	±11	4.3K	3.1%	1.6%	156 tps	0.5s	40K	$0.37	$1.10
202	GPT-3.5 Turbo	908	±15	1.2K	2.5%	1.3%	74 tps	0.9s	16K	$0.75	$1.75
203	Llama 3 8B	904	±10	3.2K	3.5%	6.0%	85 tps	0.7s	8K	$0.12	$0.16
204	Mistral Small 3.2 24B Instruct	903	±20	850	8.6%	1.9%	113 tps	1.1s	131K	$0.02	$0.08
205	GPT-4o mini	900	±14	2.8K	5.3%	2.1%	71 tps	1.7s	128K	$0.15	$0.60
206	Moonshot V1 Auto	899	±22	930	4.1%	1.2%	54 tps	1.5s	8K	$2.00	$5.00
207	Amazon Nova Pro 1.0	894	±10	5.7K	4.0%	0.9%	96 tps	0.7s	300K	$0.80	$1.70
208	GLM 4.6V Flash	892	±10	2.5K	7.6%	3.7%	64 tps	2.1s	128K	$0.04	$0.40
209	Llama 3.2 11B Instruct	885	±15	2.1K	4.1%	1.5%	152 tps	0.5s	8K	$0.16	$0.16
210	Magistral Medium 2509	883	±16	2.6K	9.5%	4.0%	58 tps	0.9s	131K	$2.00	$5.00
211	Gemma 3n E4B	882	±7	6K	4.5%	2.0%	30 tps	0.5s	8K	$0.01	$0.02
212	Qwen3 4B	880	±8	5.1K	9.6%	1.9%	94 tps	1.5s	128K	$0.01	$0.01
213	Mistral Small 3 24B Instruct	880	±10	1.7K	3.6%	2.6%	77 tps	0.6s	33K	$0.07	$0.14
214	Moonshot V1 128k	879	±19	1.1K	4.6%	1.4%	54 tps	1.5s	131K	$2.00	$5.00
215	Inception Mercury	878	±5	6.9K	3.7%	0.4%	257 tps	1.1s	32K	$0.25	$1.00
216	DeepSeek R1T2 Chimera	876	±10	2.1K	5.9%	3.0%	28 tps	1.8s	164K	$0.13	$0.45
217	Mistral Medium 3	875	±23	485	6.7%	2.4%	47 tps	0.8s	33K	$0.40	$2.00
218	Mistral Nemo	875	±15	915	2.7%	<0.1%	112 tps	0.4s	131K	$0.07	$0.13
219	Solar Mini 250422	874	±17	1.3K	5.9%	1.8%	90 tps	1.7s	33K	$0.15	$0.15
220	GLM 4.7 Flash	871	±28	610	4.7%	5.8%	61 tps	2.8s	128K	$0.07	$0.39
221	Mixtral 8x22B	871	±22	1.3K	5.0%	1.2%	140 tps	0.6s	64K	$2.00	$6.00
222	Qwen 2.5 7B Turbo	870	±25	615	6.1%	0.5%	125 tps	0.4s	131K	$0.30	$0.30
223	Krutrim Spectre V2	868	±16	1.3K	3.6%	<0.1%	33 tps	3.1s	4K	$0.19	$0.19
224	GLM 4 32B	868	±12	2.9K	4.9%	2.6%	40 tps	1.6s	33K	$0.14	$0.14
225	Gemma 3 12B	867	±11	2.5K	4.9%	4.2%	73 tps	0.8s	131K	$0.05	$0.12
226	Hermes 2 Pro Llama 3 8B	864	±21	1.8K	2.5%	<0.1%	76 tps	1.0s	131K	$0.08	$0.09
227	Mistral Small 24B Instruct	864	±16	1.5K	4.1%	1.5%	84 tps	0.4s	33K	$0.80	$0.80
228	Moonshot V1 8k	863	±13	915	5.2%	1.0%	55 tps	1.5s	8K	$0.20	$2.00
229	Qwen 2.5 14B Instruct	861	±16	2.4K	5.7%	2.4%	40 tps	1.6s	1M	$0.40	$1.61
230	Gemma 3 27B	856	±27	1.1K	6.9%	1.8%	35 tps	1.1s	66K	$0.06	$0.10
231	Mixtral 8x7B	855	±18	1.3K	5.1%	2.2%	142 tps	0.6s	33K	$0.23	$0.23
232	Ministral 3B 2512	854	±57	515	8.0%	2.8%	339 tps	0.6s	131K	$0.10	$0.10
233	Mixtral 8x7B Instruct	854	±16	1.4K	4.4%	0.2%	79 tps	0.7s	33K	$0.23	$0.31
234	Gemma 3 27B IT	853	±10	2.3K	3.9%	2.0%	60 tps	0.8s	128K	$0.17	$0.29
235	Jamba 1.5 Large	851	±9	2.9K	4.0%	1.7%	48 tps	0.9s	256K	$1.50	$6.00
236	Llama 3.3 70B Instruct Turbo	851	±19	1.2K	6.0%	2.0%	78 tps	1.0s	131K	$0.88	$0.88
237	Command R 7B	849	±15	3.3K	4.8%	1.1%	76 tps	0.4s	128K	$0.04	$0.15
238	GPT-3.5 Turbo 16k	838	±10	2.7K	3.6%	<0.1%	22 tps	0.6s	16K	$3.00	$4.00
239	ERNIE 4.5 21B A3B Thinking	838	±23	1.1K	6.9%	1.8%	87 tps	1.5s	120K	$0.07	$0.28
240	DeepSeek-R1 Distill Llama 70B	835	±9	3.4K	5.2%	3.6%	27 tps	1.6s	32K	$0.73	$0.95
241	GLM 4.5 Flash	834	±37	520	8.8%	12.2%	15 tps	2.2s	131K	$0	$0
242	Mixtral-8x7B Instruct v0.1	832	±23	1.3K	4.6%	1.3%	54 tps	0.4s	33K	$0.60	$0.60
243	Qwen 2.5 7B	831	±17	2K	5.1%	3.7%	40 tps	1.9s	131K	$0.08	$0.27
244	Sky T1 32B Preview	829	±14	2.4K	4.5%	7.8%	73 tps	0.6s	16K	$0.12	$0.18
245	LFM2 2.6B	826	±26	810	10.0%	6.7%	184 tps	0.4s	33K	$0.01	$0.02
246	Krutrim 2	825	±10	2.3K	2.3%	12.5%	33 tps	2.1s	128K	$1.00	$1.00
247	Ministral 8B	825	±17	2.2K	5.5%	1.4%	177 tps	0.4s	128K	$0.14	$0.14
248	C4AI Aya Expanse 32B	821	±7	3.8K	4.0%	1.5%	43 tps	0.5s	128K	$0.50	$1.50
249	Moonshot V1 32k	820	±17	950	3.1%	1.4%	53 tps	1.4s	33K	$1.00	$3.00
250	LFM2 8B A1B	818	±18	825	11.3%	<0.1%	142 tps	0.3s	33K	$0.01	$0.02
251	Gemma 2 27B	815	±17	1.5K	4.1%	1.4%	44 tps	1.4s	8K	$0.80	$0.80
252	Ministral 3B	806	±16	2.3K	5.1%	0.8%	248 tps	0.4s	131K	$0.08	$0.08
253	Magistral Small 2509	802	±18	1.8K	7.5%	2.7%	116 tps	0.6s	131K	$0.50	$1.50
254	Gemma 3 1B	802	±11	2K	6.1%	0.6%	176 tps	1.0s	33K	$0.06	$0.10
255	WizardLM-2 8x22B	801	±12	1.9K	3.1%	11.6%	11 tps	2.5s	66K	$0.77	$0.77
256	Phi 4	798	±16	1.7K	3.4%	5.1%	28 tps	1.3s	128K	$0.10	$0.32
257	Hermes 4 405B FP8	797	±21	815	8.4%	3.5%	31 tps	0.9s	131K	$0.52	$1.73
258	Mercury Coder	793	±27	510	3.8%	<0.1%	247 tps	2.2s	32K	$0.25	$1.00
259	GPT-3.5 Turbo Instruct	787	±9	2K	2.7%	<0.1%	46 tps	1.2s	4K	$1.50	$2.00
260	Mistral Large	785	±16	1.1K	5.8%	1.5%	54 tps	0.7s	33K	$2.00	$6.00
261	Hermes 4 70B	781	±29	460	8.9%	1.1%	67 tps	0.6s	131K	$0.12	$0.39
262	Command R	778	±18	2.2K	4.9%	5.8%	54 tps	0.6s	128K	$0.30	$0.99
263	Baichuan-M2-32B	770	±30	740	10.8%	<0.1%	32 tps	3.3s	131K	$0.07	$0.07
264	Mistral Small	770	±12	1.2K	4.5%	1.7%	142 tps	0.6s	32K	$0.43	$1.30
265	Open Mistral 7B	762	±18	1.3K	4.7%	0.7%	176 tps	0.4s	33K	$0.25	$0.25
266	Hermes 4 405B Reasoning FP8	759	±11	2.7K	12.8%	3.6%	32 tps	0.8s	131K	$1.00	$3.00
267	Goliath 120B	754	±24	745	5.7%	2.7%	21 tps	2.2s	6K	$6.56	$9.38
268	Qwen 2.5 VL 72B Instruct	746	±20	2.1K	6.0%	5.3%	25 tps	3.7s	128K	$1.01	$2.79
269	Gemma 3 4B	742	±10	3.3K	4.7%	1.3%	138 tps	0.7s	131K	$0.02	$0.04
270	Mixtral 8x22B Instruct	738	±17	1.4K	5.6%	1.8%	142 tps	0.7s	66K	$0.45	$0.45
271	Command R+	738	±15	1.6K	5.6%	2.8%	36 tps	0.7s	128K	$2.08	$9.45
272	Inflection 3 Productivity	737	±24	1.5K	5.0%	0.6%	50 tps	3.2s	8K	$2.50	$10.00
273	Pixtral 12B	722	±21	3K	6.3%	2.2%	101 tps	1.2s	131K	$0.08	$0.08
274	Inflection 3 Pi	719	±18	1.5K	4.1%	1.1%	33 tps	3.4s	8K	$2.50	$10.00
275	DeepHermes 3 Mistral 24B Preview	706	±30	715	5.9%	2.5%	50 tps	1.0s	33K	$0.06	$0.25
276	Hermes 3 405B Instruct	702	±20	1.4K	4.1%	2.3%	20 tps	1.1s	131K	$0.80	$0.80
277	DeepSeek-R1 Distill Qwen 32B	696	±20	2K	5.5%	6.2%	22 tps	1.8s	131K	$0.37	$0.39
278	MiniMax M1	686	±13	3.8K	5.3%	<0.1%	31 tps	2.8s	1M	$0.55	$2.20
279	UI-TARS 1.5 7B	610	±40	530	11.7%	4.0%	75 tps	0.9s	128K	$0.10	$0.20
280	MythoMax L2 13B	600	±21	2.3K	5.8%	1.2%	22 tps	1.1s	4K	$0.18	$0.18
281	Phi 4 Mini Instruct	599	±21	1K	7.1%	7.4%	40 tps	1.1s	128K	$0.07	$0.30
282	Hunyuan A13B Instruct	588	±22	1.6K	9.2%	2.3%	67 tps	2.0s	33K	$0.01	$0.01
283	Phi 4 Reasoning	573	±17	2.1K	5.5%	21.0%	29 tps	1.0s	33K	$0.06	$0.25
284	Qwen 2.5 VL 3B Instruct	523	±25	4.1K	6.1%	3.0%	44 tps	2.5s	128K	$0.21	$0.63
285	CodeLlama 7B Instruct Solidity	463	±54	485	8.5%	3.6%	33 tps	0.7s	16K	$0.80	$1.20
286	Phi 4 Mini Reasoning	447	±15	3.4K	12.0%	9.7%	30 tps	0.9s	128K	$0.07	$0.30

Show Less