Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Language

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1446

GPT-5.4

1440

Claude Opus 4.6 (Thinking)

1420

Claude Opus 4.6

1415

GPT-5.4 (High)

1377

Claude Sonnet 4.6 (Thinking)

1346

GPT-5.1 (Medium)

1345

Claude Sonnet 4.6

1319

Claude Sonnet 4.5 (Thinking)

1317

Gemini 3.1 Pro

1295

GPT-5.1

1285

Gemini 3 Pro

1272

Claude Opus 4.5 (Thinking)

1272

Gemini 3 Flash Preview Thinking

1262

Gemini 3 Pro (Low)

1262

GPT-5.2 Instant

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
1	2	GPT-5.4	1446	±14	1.7K	1.7%	2.6%	55 tps	0.8s	1M	$2.50	$15.00
2	1	Claude Opus 4.6 (Thinking)	1440	±9	5.1K	1.2%	2.5%	56 tps	1.6s	200K	$5.00	$25.00
3	2	Claude Opus 4.6	1420	±11	6.5K	1.1%	2.1%	48 tps	1.7s	200K	$5.00	$25.00
4	4	GPT-5.4 (High)	1415	±12	2.1K	1.4%	4.6%	68 tps	7.9s	1M	$2.50	$15.00
5	5	Claude Sonnet 4.6 (Thinking)	1377	±9	4.9K	1.3%	4.7%	57 tps	1.1s	200K	$3.00	$15.00
6	8	GPT-5.1 (Medium)	1346	±14	785	1.9%	<0.1%	86 tps	3.8s	400K	$0.83	$6.67
7	4	Claude Sonnet 4.6	1345	±11	4.7K	1.3%	1.6%	47 tps	1.2s	200K	$3.00	$15.00
8	10	Claude Sonnet 4.5 (Thinking)	1319	±4	6.7K	2.4%	1.9%	44 tps	1.1s	200K	$3.00	$15.00
9	6	Gemini 3.1 Pro	1317	±8	7.9K	1.6%	3.5%	35 tps	4.1s	1M	$2.00	$12.00
10	8	GPT-5.1	1295	±7	4.3K	2.2%	2.3%	71 tps	1.4s	400K	$1.42	$11.33
11	10	Gemini 3 Pro	1285	±9	17.6K	1.5%	2.1%	50 tps	3.6s	1M	$2.00	$12.00
12	7	Claude Opus 4.5 (Thinking)	1272	±7	11.3K	2.0%	1.8%	49 tps	1.4s	200K	$5.00	$25.00
13	14	Gemini 3 Flash Preview Thinking	1272	±9	7.9K	1.8%	1.6%	3 tps	6.2s	1M	$0.50	$3.00
14	14	Gemini 3 Pro (Low)	1262	±6	6.1K	2.2%	2.4%	51 tps	3.5s	1M	$2.00	$12.00
15	10	GPT-5.2 Instant	1262	±7	6.9K	1.8%	1.7%	52 tps	2.0s	400K	$1.75	$14.00
16	17	Claude Opus 4.5	1259	±7	4.1K	2.9%	1.5%	45 tps	1.5s	200K	$5.00	$25.00
17	16	GPT-5.2	1254	±11	4.5K	1.8%	4.1%	18 tps	2.7s	400K	$1.75	$14.00
18	8	GPT-5.1 (High)	1252	±8	6.4K	1.9%	3.2%	76 tps	6.9s	400K	$1.25	$10.00
19	17	Gemini 3 Flash Preview	1248	±12	3.9K	2.2%	1.3%	138 tps	1.4s	1M	$0.50	$3.00
20	22	GPT-5 Chat	1243	±7	11.4K	2.5%	1.3%	95 tps	0.9s	400K	$1.25	$10.00
21	13	GPT-5.3 Instant	1240	±14	4.5K	1.9%	0.9%	63 tps	0.8s	400K	$1.75	$14.00
22	17	GPT-5.2 (High)	1236	±8	11.2K	1.8%	6.7%	18 tps	16.3s	400K	$1.75	$14.00
23	37	Claude Sonnet 4.5	1230	±6	4.7K	4.1%	1.4%	41 tps	1.3s	200K	$1.80	$9.00
24	43	Gemini 2.5 Flash Thinking Preview 0925	1211	±7	2.6K	2.9%	<0.1%	111 tps	4.7s	1M	$0.30	$2.50
25	17	Grok 4.20 Beta Reasoning	1209	±21	915	2.1%	1.1%	77 tps	4.5s	2M	$2.00	$5.50
26	26	Claude Haiku 4.5 (Extended Thinking)	1196	±6	3K	2.6%	1.4%	115 tps	0.7s	200K	$1.00	$5.00
27	32	Gemini 2.5 Pro High	1191	±6	6.1K	3.2%	1.5%	48 tps	2.3s	1M	$1.25	$10.00
28	56	Gemini 2.5 Pro Low	1186	±7	2.9K	3.3%	<0.1%	89 tps	2.4s	1M	$1.25	$10.00
29	44	Gemini 2.5 Pro	1184	±5	13.8K	2.9%	2.3%	45 tps	2.6s	1M	$1.25	$10.00
30	62	GPT-5.1 Instant	1168	±7	4.3K	2.5%	1.3%	50 tps	1.9s	400K	$1.25	$10.00
31	52	Claude Haiku 4.5	1163	±8	5.3K	4.1%	1.1%	100 tps	0.9s	200K	$1.00	$5.00
32	71	Gemini 2.5 Flash Thinking	1161	±4	6.8K	3.0%	2.2%	88 tps	6.4s	1M	$0.30	$2.50
33	60	MiniMax M2.1	1159	±11	2.1K	2.1%	2.1%	66 tps	2.6s	205K	$0.30	$1.20
34	33	Grok 4.20 Multi Agent Beta	1158	±23	665	1.5%	1.2%	56 tps	8.8s	2M	$2.00	$6.00
35	21	Claude Opus 4 (Thinking)	1156	±18	715	3.4%	<0.1%	28 tps	1.3s	200K	$15.00	$75.00
36	42	GPT-5.2 (Extra High)	1146	±10	3.5K	2.3%	13.2%	17 tps	20.5s	400K	$1.75	$14.00
37	86	Claude Sonnet 4	1138	±7	7.4K	2.3%	1.8%	49 tps	1.3s	200K	$3.00	$15.00
38	71	Gemini 2.5 Flash Lite Preview 0925	1134	±9	3.5K	3.4%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
39	56	Gemini 3.1 Flash Lite Preview Thinking	1132	±12	1.7K	3.9%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
40	22	GLM 5	1132	±12	1.7K	1.4%	3.4%	36 tps	2.7s	200K	$0.72	$2.55
41	40	Qwen3 235B A22B Instruct 2507	1126	±8	2.1K	2.5%	6.8%	13 tps	1.9s	262K	$0.13	$0.52
42	60	Gemini 2.5 Flash Preview 0925	1124	±9	3.4K	3.4%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
43	56	Claude Opus 4.1 (Thinking)	1119	±10	2.1K	5.0%	<0.1%	20 tps	3.9s	200K	$15.00	$75.00
44	48	Claude Sonnet 4 (Thinking)	1116	±7	5.3K	4.2%	1.5%	52 tps	1.5s	200K	$3.00	$13.67
45	26	GPT-5 (High)	1115	±7	3.7K	3.6%	4.5%	81 tps	35.9s	400K	$1.25	$10.00
46	52	GPT-5	1115	±8	5.4K	3.7%	3.1%	78 tps	23.1s	400K	$1.25	$9.67
47	81	GPT-4o	1113	±8	2.2K	3.6%	1.0%	49 tps	2.4s	128K	$3.71	$12.57
48	29	Nova Experimental Chat 12-10	1110	±25	710	1.4%	2.4%	84 tps	12.9s	98K	$0	$0
49	77	GPT-4.5 Preview	1106	±16	520	2.8%	<0.1%	36 tps	3.0s	200K	$75.00	$150.00
50	95	Gemini 2.5 Flash	1104	±7	9.8K	2.7%	1.3%	2 tps	3.7s	1M	$0.30	$2.50
51	42	Qwen3 Max Instruct Preview	1103	±13	2.2K	2.0%	1.1%	31 tps	1.7s	256K	$1.43	$6.61
52	68	Grok 4	1102	±7	7.8K	3.3%	3.9%	29 tps	11.1s	256K	$3.00	$15.00
53	19	Mistral Medium 3.1	1101	±10	1.9K	3.5%	<0.1%	77 tps	0.7s	128K	$0.40	$2.00
54	21	Claude Opus 4	1101	±8	2.3K	3.2%	<0.1%	25 tps	1.5s	200K	$15.00	$75.00
55	37	Kimi K2.5 Instant	1093	±12	1.4K	2.7%	2.9%	32 tps	3.0s	262K	$0.50	$3.00
56	33	Kimi K2.5	1090	±13	4.3K	2.1%	6.5%	33 tps	1.7s	262K	$0.34	$2.57
57	16	Nova Experimental Chat 11-10	1089	±23	750	2.6%	0.4%	84 tps	8.9s	98K	$0	$0
58	95	Gemini 2.5 Flash Lite Thinking Preview 0925	1086	±8	3.4K	2.7%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
59	48	OpenAI o1-mini	1086	±8	2.2K	2.2%	<0.1%	118 tps	N/A	128K	$1.13	$4.51
60	71	DeepSeek V3.1	1085	±14	690	3.5%	0.8%	197 tps	0.4s	164K	$0.55	$1.60
61	77	Claude Opus 4.1	1084	±6	2.4K	4.3%	3.0%	17 tps	3.7s	200K	$15.00	$75.00
62	33	Qwen3 30B A3B Instruct 2507	1084	±8	2.3K	3.2%	1.2%	55 tps	1.3s	131K	$0.13	$0.72
63	33	Qwen3 Next 80B A3B Instruct	1083	±16	1.5K	2.6%	0.6%	84 tps	1.1s	256K	$0.20	$1.42
64	84	Claude Sonnet 3.7 (Thinking)	1078	±8	3.8K	4.7%	<0.1%	41 tps	2.6s	200K	$3.00	$15.00
65	48	gpt-oss-120b	1074	±6	3K	2.6%	0.7%	213 tps	0.5s	131K	$0.11	$0.50
66	44	Kimi K2 Thinking Turbo	1072	±17	1.3K	2.2%	2.0%	75 tps	1.4s	262K	$1.15	$8.00
67	65	DeepSeek V3.2 Exp Chat	1072	±12	755	2.6%	2.6%	29 tps	1.5s	131K	$0.27	$0.39
68	68	GLM 4.7	1071	±12	1.9K	2.1%	5.8%	40 tps	1.5s	200K	$0.77	$1.73
69	113	Gemini 2.5 Flash Lite Thinking	1071	±10	2.3K	3.2%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
70	56	DeepSeek V3.1 Turbo	1070	±12	1.3K	2.6%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
71	48	Step 3.5 Flash	1067	±20	630	2.3%	2.2%	109 tps	0.6s	256K	$0.05	$0.15
72	71	Qwen3.5 397B A17B	1067	±15	1.3K	2.2%	4.3%	57 tps	1.4s	256K	$0.52	$3.00
73	52	Qwen3.5 122B A17B	1063	±14	980	1.5%	1.5%	82 tps	1.4s	256K	$0.40	$3.20
74	71	Gemini 3.1 Flash Lite Preview	1060	±22	1.2K	3.3%	1.0%	8 tps	1.2s	1M	$0.25	$1.50
75	26	Grok 4.1 Fast Non-Reasoning	1058	±19	2K	4.1%	0.9%	101 tps	0.5s	2M	$0.20	$0.50
76	44	DeepSeek V3.1 Terminus Chat	1056	±13	955	2.1%	3.4%	27 tps	1.5s	131K	$0.86	$1.80
77	81	Qwen3.5 27B	1056	±17	665	2.9%	3.7%	55 tps	2.6s	256K	$0.30	$2.40
78	40	DeepSeek V3.2	1056	±15	1.4K	1.4%	1.4%	83 tps	5.1s	131K	$0.43	$1.09
79	106	Claude Sonnet 3.5 v2	1055	±22	770	3.8%	<0.1%	46 tps	1.4s	200K	$3.00	$15.00
80	100	Gemini 2.5 Flash Preview	1050	±18	565	2.6%	<0.1%	138 tps	6.9s	1M	$0.15	$0.60
81	48	Grok 4 Fast Reasoning	1049	±10	2.3K	3.6%	2.1%	102 tps	3.1s	2M	$0.30	$0.75
82	118	GPT-4.1 mini	1045	±8	3.4K	2.5%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
83	113	Mistral Medium	1043	±11	1.1K	3.1%	1.8%	48 tps	0.6s	33K	$1.48	$4.55
84	86	Amazon Nova 2 Lite	1042	±23	690	2.1%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
85	101	Gemini 2.5 Flash Lite	1042	±6	7.8K	4.3%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
86	37	Qwen3 Omni 30B A3B Thinking	1040	±20	750	2.0%	3.7%	67 tps	1.2s	66K	$0.97	$1.79
87	113	GLM 4.5	1038	±12	915	3.2%	3.7%	46 tps	1.4s	131K	$0.43	$1.63
88	93	DeepSeek V3 0324 Turbo	1038	±9	2.2K	1.8%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
89	95	DeepSeek V3.2 Exp Thinking	1038	±17	655	3.7%	7.2%	26 tps	3.0s	131K	$0.28	$0.42
90	86	DeepSeek V3.1 Chat	1038	±13	975	2.5%	2.8%	21 tps	1.6s	131K	$0.38	$1.00
91	29	Qwen3 VL 235B A22B Instruct	1036	±16	1.3K	4.2%	3.1%	75 tps	1.9s	129K	$0.37	$1.81
92	106	Grok 3	1034	±8	2.8K	2.8%	1.5%	53 tps	0.6s	1M	$3.67	$18.33
93	79	MiniMax M2.5 Lightning	1031	±20	820	1.8%	1.5%	51 tps	2.0s	205K	$0.60	$2.40
94	52	Grok 4 Fast Non-Reasoning	1030	±17	1.5K	4.1%	1.5%	93 tps	0.6s	2M	$0.27	$0.67
95	111	Claude Sonnet 3.7	1027	±9	4K	4.9%	<0.1%	39 tps	1.6s	200K	$3.00	$15.00
96	68	Qwen Plus (Aug'24)	1023	±9	2.4K	2.9%	1.4%	53 tps	1.3s	30K	$0.40	$1.20
97	56	DeepSeek V3.2 Thinking	1021	±13	1.9K	1.8%	9.0%	30 tps	2.6s	131K	$0.28	$0.42
98	44	Grok 4.1 Fast Reasoning	1020	±7	3.7K	3.0%	1.5%	58 tps	7.3s	2M	$0.20	$0.50
99	56	MiniMax M2.1 Lightning	1019	±24	830	1.8%	1.7%	52 tps	2.1s	205K	$0.30	$2.40
100	71	GPT-5 Mini	1017	±10	3.1K	5.2%	2.6%	66 tps	14.2s	400K	$0.25	$2.00
101	106	DeepSeek V3 0324	1013	±11	2.1K	3.1%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
102	124	Qwen3 235B A22B Thinking 2507	1010	±16	745	3.2%	2.5%	53 tps	1.6s	131K	$0.59	$5.70
103	95	DeepSeek-R1 Turbo	1009	±20	660	3.6%	2.6%	29 tps	1.8s	64K	$2.85	$4.75
104	93	Qwen Max	1009	±11	2.7K	2.7%	1.5%	49 tps	1.5s	33K	$1.60	$6.40
105	80	GPT-5 (Minimal)	1003	±10	1.9K	5.4%	<0.1%	67 tps	1.4s	400K	$1.25	$10.00
106	133	DeepSeek-R1 0528	1001	±15	1.1K	4.1%	1.3%	93 tps	0.5s	64K	$1.60	$3.67
107	106	DeepSeek V3.1 Terminus Thinking	1000	±14	745	2.6%	5.9%	27 tps	1.8s	131K	$0.56	$1.68
108	65	GLM 4.6	991	±15	945	3.6%	5.4%	39 tps	1.5s	200K	$0.42	$1.66
109	147	GLM 4.5 Air	991	±16	1.1K	2.7%	<0.1%	22 tps	1.4s	131K	$0.10	$0.38
110	37	Nova Experimental Chat 10-20	984	±20	555	5.1%	<0.1%	30 tps	0.5s	98K	$0	$0
111	71	Seed 1.8 251228	983	±10	3K	2.6%	3.7%	41 tps	2.1s	256K	$0.25	$2.00
112	113	Kimi K2 Fast	975	±10	4.8K	2.3%	0.8%	365 tps	0.5s	131K	$1.00	$3.00
113	143	Gemini 2.0 Flash	974	±19	1.9K	4.7%	<0.1%	76 tps	0.5s	1M	$0.14	$0.56
114	133	GPT-4.1 nano	974	±11	2.3K	3.4%	0.6%	175 tps	0.5s	1M	$0.10	$0.40
115	148	OpenAI o3	970	±10	1.2K	3.1%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
116	129	Command A	965	±8	3K	2.9%	2.2%	42 tps	0.8s	256K	$2.00	$7.33
117	111	LongCat Flash Chat	963	±25	560	4.3%	0.8%	85 tps	0.9s	131K	$0.14	$0.68
118	111	Solar Pro 3 (Reasoning)	960	±23	505	1.0%	3.2%	118 tps	1.2s	131K	$0.15	$0.60
119	153	OpenAI o1	960	±11	2.3K	2.4%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
120	126	DeepSeek V3	960	±7	3.4K	2.3%	0.9%	69 tps	1.1s	64K	$0.59	$1.49
121	148	OpenAI o4-mini-high	958	±11	2.2K	3.1%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
122	139	OpenAI o4-mini	956	±16	1.4K	2.8%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
123	129	DeepSeek V3.1 Thinking	955	±14	1.1K	2.2%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
124	79	Qwen3 Max Thinking Preview	952	±20	1.1K	2.2%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
125	81	OpenAI o3-pro	951	±19	1.6K	3.4%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
126	101	gpt-oss-20b	950	±18	1.4K	4.7%	0.5%	216 tps	0.5s	131K	$0.06	$0.26
127	101	Qwen3.5 35B A3B	949	±27	530	2.8%	2.1%	116 tps	2.1s	256K	$0.63	$1.13
128	65	Mistral Large 3	947	±20	1.3K	4.4%	2.1%	51 tps	1.0s	256K	$0.50	$1.50
129	143	Seed 1.6 250615	928	±21	635	5.2%	3.1%	46 tps	2.2s	256K	$0.25	$2.00
130	241	GPT-5 Mini High	926	±15	880	4.9%	<0.1%	33 tps	3.9s	400K	$0.25	$2.00
131	95	Kimi K2 Thinking	926	±17	740	2.0%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
132	124	Kimi K2 0905 Turbo	925	±13	1.5K	4.7%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
133	211	Gemini 1.5 Pro	925	±20	750	4.5%	<0.1%	15 tps	0.0s	2M	$0.78	$3.13
134	133	Kimi K2 0905	922	±21	805	4.2%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
135	126	Qwen3 VL 235B A22B Thinking	922	±18	745	4.5%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
136	133	Solar Pro 2 250710	918	±14	1.4K	3.4%	<0.1%	9 tps	N/A	66K	$0.50	$0.50
137	119	ERNIE 4.5 300B A47B	918	±17	1.6K	2.7%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
138	126	Qwen3 30B A3B	918	±15	865	3.4%	5.1%	163 tps	1.0s	41K	$0.06	$0.21
139	143	Gemini 2.0 Flash Lite	917	±11	2.5K	6.7%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
140	121	QwQ 32B	910	±13	1.8K	3.1%	5.4%	41 tps	2.1s	16K	$0.43	$0.56
141	62	MiniMax M2	905	±18	1.4K	3.5%	2.2%	39 tps	2.3s	205K	$0.21	$0.85
142	213	Claude Haiku 3.5	901	±10	2.7K	5.9%	0.8%	40 tps	2.8s	200K	$0.80	$4.00
143	177	OpenAI o3-mini	901	±12	2.5K	3.1%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
144	139	Seed 2.0 Mini (Medium)	900	±30	515	3.7%	11.9%	33 tps	1.7s	256K	$0.15	$0.60
145	86	Qwen3 235B A22B	898	±23	725	3.3%	5.3%	71 tps	0.9s	41K	$0.23	$0.63
146	302	YouTube	896	±16	2.4K	5.6%	<0.1%	34 tps	2.7s	32K	$0.99	$0.99
147	148	DeepSeek-R1	894	±12	1.1K	3.8%	0.8%	133 tps	0.6s	64K	$0.91	$3.07
148	161	Llama 4 Maverick	883	±12	3.6K	4.4%	1.2%	88 tps	2.4s	1M	$0.23	$0.83
149	165	Qwen3 4B	878	±23	735	3.9%	1.9%	94 tps	1.5s	128K	$0.01	$0.01
150	270	Solar Pro 2 250710 (Reasoning)	878	±25	505	3.8%	<0.1%	9 tps	N/A	66K	$0.50	$0.50
151	160	Llama 4 Scout	875	±15	2.3K	2.9%	0.6%	88 tps	5.1s	131K	$0.18	$0.46
152	179	GLM 4.7 Flash	874	±24	855	2.8%	5.8%	61 tps	2.8s	128K	$0.07	$0.39
153	246	DeepSeek-R1 Distill Llama 70B	869	±28	590	4.8%	3.6%	27 tps	1.6s	32K	$0.73	$0.95
154	214	OpenAI o3-mini-high	868	±13	1.4K	3.8%	2.4%	231 tps	10.5s	200K	$1.10	$4.40
155	129	Qwen3 Max Thinking	866	±14	1.5K	1.7%	13.5%	32 tps	2.3s	256K	$1.20	$6.00
156	139	GLM 4.6V	865	±24	890	2.7%	6.4%	21 tps	1.8s	128K	$0.38	$0.90
157	170	Kimi K2 0711	858	±24	890	4.3%	1.6%	29 tps	1.3s	131K	$0.72	$2.60
158	133	Qwen3 14B	856	±24	745	2.6%	1.7%	109 tps	0.8s	41K	$0.04	$0.15
159	121	Qwen3 32B Fast	853	±13	1.8K	4.2%	11.6%	30 tps	3.1s	41K	$0.10	$0.25
160	157	Qwen3 Next 80B A3B Thinking	846	±15	1.3K	3.9%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
161	157	GPT-5 Nano	843	±14	2K	6.0%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
162	175	OpenAI o3-mini-low	838	±21	1.7K	2.6%	0.7%	139 tps	1.5s	200K	$1.10	$4.40
163	84	GPT-5 Mini Minimal	835	±13	1.1K	6.6%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
164	186	Grok 3 Mini Fast	832	±23	1K	3.3%	1.6%	44 tps	0.5s	131K	$0.60	$4.00
165	133	DeepSeek V3.2 Speciale	830	±28	540	3.6%	6.0%	43 tps	1.4s	131K	$0.84	$1.52
166	161	Qwen3 8B	827	±36	600	4.0%	2.4%	61 tps	1.4s	41K	$0.02	$0.07
167	201	GPT-4o mini	826	±18	645	6.5%	2.1%	71 tps	1.7s	128K	$0.15	$0.60
168	86	Nemotron 3 Nano (Thinking)	821	±23	540	4.4%	2.0%	200 tps	0.5s	256K	$0	$0
169	148	Qwen3 30B A3B Thinking 2507	818	±18	795	3.0%	0.5%	124 tps	1.2s	131K	$0.16	$1.70
170	213	DeepSeek R1T Chimera	805	±25	510	3.8%	<0.1%	46 tps	1.1s	164K	$0.09	$0.36
171	265	Qwen 2.5 VL 72B Instruct	804	±29	715	6.5%	5.3%	25 tps	3.7s	128K	$1.01	$2.79
172	147	Arcee AI Maestro Reasoning	802	±17	480	4.0%	<0.1%	85 tps	0.3s	131K	$0.90	$3.30
173	229	Magistral Medium 2509	797	±17	570	5.0%	4.0%	58 tps	0.9s	131K	$2.00	$5.00
174	108	GPT-5 Mini Low	796	±16	865	7.0%	<0.1%	69 tps	3.2s	400K	$0.25	$2.00
175	265	Magistral Small 2509	790	±29	530	6.2%	2.7%	116 tps	0.6s	131K	$0.50	$1.50
176	186	Gemma 3n E4B	781	±27	535	4.5%	2.0%	30 tps	0.5s	8K	$0.01	$0.02
177	159	Qwen Turbo	779	±15	860	2.8%	<0.1%	53 tps	1.1s	1M	$0.05	$0.20
178	165	Pixtral Large	778	±18	1.1K	7.2%	2.5%	57 tps	1.3s	128K	$1.50	$4.50
179	194	Llama 3.3 70B	745	±30	525	4.5%	0.3%	500 tps	0.5s	8K	$0.48	$0.66
180	274	Pixtral 12B	744	±33	940	9.6%	2.2%	101 tps	1.2s	131K	$0.08	$0.08
181	186	Grok 3 Mini	739	±20	1.4K	2.5%	1.2%	43 tps	0.5s	131K	$0.30	$0.50
182	186	GLM 4.6V Flash	726	±29	575	2.5%	3.7%	64 tps	2.1s	128K	$0.04	$0.40
183	182	Fauna Fox	715	±28	490	4.9%	<0.1%	194 tps	0.3s	128K	$0.04	$0.15
184	277	Wikipedia	682	±34	550	9.8%	<0.1%	47 tps	2.1s	32K	$0	$0
185	292	GPT-5 Nano Minimal	621	±18	590	7.8%	<0.1%	88 tps	0.8s	400K	$0.05	$0.40
186	314	DeepSeek-R1 0528 Qwen3 8B	552	±23	565	5.8%	<0.1%	45 tps	2.4s	128K	$0.05	$0.09
187	288	Qwen 2.5 VL 3B Instruct	546	±31	1K	9.1%	3.0%	44 tps	2.5s	128K	$0.21	$0.63
188	292	AFM 4.5B	305	±46	585	5.6%	<0.1%	81 tps	0.3s	66K	$0.05	$0.20

Show Less