Leaderboard | Coding

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1085

Qwen3 Omni 30B A3B Instruct

1082

DeepSeek V3 (Turbo)

1081

Solar Pro 2 250710

1081

Seed 1.8 251228

1080

Mistral Medium

1080

Qwen3 Max Thinking

1075

GLM 4.5

1074

Kimi K2 0905

1070

GPT-5 (Low)

1070

Kimi K2 0905 Turbo

1064

Qwen Turbo

1063

Grok 4.20 Beta Non-reasoning

1062

OpenAI o1

1061

OpenAI o1-pro

1061

Gemini 2.5 Flash Lite Thinking

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
121	105	Qwen3 Omni 30B A3B Instruct	1085	±13	775	4.3%	3.9%	65 tps	1.2s	66K	$0.35	$0.97
122	105	DeepSeek V3 (Turbo)	1082	±20	1.5K	5.1%	1.5%	32 tps	1.5s	64K	$0.40	$1.30
123	132	Solar Pro 2 250710	1081	±5	10.6K	6.9%	<0.1%	9 tps	N/A	66K	$0.50	$0.50
124	105	Seed 1.8 251228	1081	±10	3.2K	3.1%	3.7%	41 tps	2.1s	256K	$0.25	$2.00
125	105	Mistral Medium	1080	±4	9.6K	5.6%	1.8%	48 tps	0.6s	33K	$1.48	$4.55
126	105	Qwen3 Max Thinking	1080	±18	1.5K	2.0%	13.5%	32 tps	2.3s	256K	$1.20	$6.00
127	112	GLM 4.5	1075	±5	6K	7.0%	3.7%	46 tps	1.4s	131K	$0.43	$1.63
128	112	Kimi K2 0905	1074	±7	8.7K	4.3%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
129	112	GPT-5 (Low)	1070	±14	690	3.5%	1.8%	75 tps	8.2s	400K	$1.25	$10.00
130	112	Kimi K2 0905 Turbo	1070	±6	7.5K	9.1%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
131	144	Qwen Turbo	1064	±5	10K	6.0%	<0.1%	53 tps	1.1s	1M	$0.05	$0.20
132	112	Grok 4.20 Beta Non-reasoning	1063	±36	500	4.8%	1.1%	151 tps	0.6s	2M	$2.00	$6.00
133	119	OpenAI o1	1062	±6	9.9K	3.3%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
134	119	OpenAI o1-pro	1061	±20	680	7.5%	5.2%	33 tps	72.8s	200K	$150.00	$600.00
135	119	Gemini 2.5 Flash Lite Thinking	1061	±4	9.8K	6.2%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
136	151	GLM 4.5 FP8	1060	±18	610	8.3%	<0.1%	59 tps	1.2s	131K	$0.41	$1.65
137	119	Seed 2.0 Lite (Medium)	1058	±20	525	3.7%	6.6%	33 tps	1.6s	256K	$0.25	$2.00
138	119	LongCat Flash Chat	1058	±12	2.7K	5.9%	0.8%	85 tps	0.9s	131K	$0.14	$0.68
139	151	OpenAI Codex Mini	1057	±5	9.8K	3.3%	<0.1%	46 tps	2.1s	200K	$1.50	$6.00
140	119	GPT-5.1 Codex Mini (Medium)	1057	±15	1.9K	4.9%	4.6%	69 tps	4.1s	400K	$0.25	$2.00
141	119	GPT-5.1 Codex Mini (High)	1054	±15	2.2K	3.9%	5.9%	70 tps	4.6s	400K	$0.25	$2.00
142	151	GLM 4.5 X	1051	±16	645	5.8%	<0.1%	48 tps	2.8s	131K	$2.20	$8.90
143	128	ERNIE 4.5 300B A47B	1049	±4	13.5K	3.9%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
144	164	Arcee AI Maestro Reasoning	1046	±7	3.8K	4.6%	<0.1%	85 tps	0.3s	131K	$0.90	$3.30
145	128	Cogito v2.1 671B	1044	±19	1.2K	4.6%	0.8%	85 tps	0.5s	128K	$1.25	$1.25
146	128	Qwen3 32B	1044	±19	850	6.6%	3.9%	30 tps	3.1s	41K	$0.12	$0.42
147	164	Grok 4 0709 EU	1043	±11	1.3K	5.7%	<0.1%	33 tps	8.2s	128K	$3.00	$15.00
148	128	GLM 4.5 AirX	1042	±15	1.1K	6.9%	3.3%	75 tps	1.2s	131K	$1.10	$4.50
149	128	Kimi K2 Thinking	1042	±10	3.3K	5.1%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
150	128	OpenAI o4-mini	1042	±5	8.5K	6.4%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
151	164	EXAONE Deep 32B	1040	±14	880	1.7%	<0.1%	24 tps	N/A	33K	$0	$0
152	128	Gemini 3.1 Flash Lite Preview Thinking	1039	±16	1.4K	4.2%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
153	135	Qwen3 Next 80B A3B Thinking	1035	±5	6.2K	7.4%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
154	135	Gemini 2.5 Flash Lite Thinking Preview 0925	1035	±7	5.8K	6.8%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
155	135	Gemini 3.1 Flash Lite Preview	1034	±21	980	4.4%	1.0%	8 tps	1.2s	1M	$0.25	$1.50
156	135	DeepSeek V3.2 Speciale	1030	±10	2.3K	6.1%	6.0%	43 tps	1.4s	131K	$0.84	$1.52
157	135	Gemini 2.0 Flash Lite	1029	±5	14.7K	9.5%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
158	174	Claude Haiku 3.5	1028	±6	6.4K	4.9%	0.8%	40 tps	2.8s	200K	$0.80	$4.00
159	135	Amazon Nova 2 Lite	1026	±10	3.6K	6.0%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
160	144	DeepSeek V3.1 Nex N1	1021	±19	565	5.0%	3.4%	24 tps	7.2s	131K	$0.14	$0.50

4of8

View All (305 models)