Leaderboard | Coding

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

979

DeepSeek-R1 0528

980

Mistral Small 3.1 24B Instruct

981

Seed 2.0 Mini (Medium)

981

Kimi K2 0711

986

GLM 4.6V

987

Grok Code Fast 1

988

OpenAI o3-mini-low

989

GPT-5 Nano

994

Qwen3 30B A3B

995

Seed 1.6 250615

995

OpenAI o4-mini-high

999

OpenAI o3-mini

999

OpenAI o3-mini-high

1000

Qwen3 235B A22B Thinking 2507

1001

Qwen 2.5 VL 32B Instruct

Last updated about 1 month ago

Rank	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
121	DeepSeek-R1 0528	979	±6	5.5K	3.5%	1.3%	93 tps	0.5s	64K	$1.60	$3.67
122	Mistral Small 3.1 24B Instruct	980	±11	2.9K	4.3%	7.5%	15 tps	2.4s	131K	$0.06	$0.18
123	Seed 2.0 Mini (Medium)	981	±35	570	5.8%	11.9%	33 tps	1.7s	256K	$0.15	$0.60
124	Kimi K2 0711	981	±6	7K	4.5%	1.6%	29 tps	1.3s	131K	$0.72	$2.60
125	GLM 4.6V	986	±8	3K	5.5%	6.4%	21 tps	1.8s	128K	$0.38	$0.90
126	Grok Code Fast 1	987	±9	2.5K	6.0%	5.9%	294 tps	0.5s	256K	$0.20	$1.50
127	OpenAI o3-mini-low	988	±6	12.2K	6.4%	0.7%	139 tps	1.5s	200K	$1.10	$4.40
128	GPT-5 Nano	989	±6	4.6K	8.0%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
129	Qwen3 30B A3B	994	±8	6.3K	6.9%	5.1%	163 tps	1.0s	41K	$0.06	$0.21
130	Seed 1.6 250615	995	±21	1.6K	6.0%	3.1%	46 tps	2.2s	256K	$0.25	$2.00
131	OpenAI o4-mini-high	995	±7	13.6K	6.2%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
132	OpenAI o3-mini	999	±4	15K	5.5%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
133	OpenAI o3-mini-high	999	±5	8.3K	4.1%	2.4%	231 tps	10.5s	200K	$1.10	$4.40
134	Qwen3 235B A22B Thinking 2507	1000	±10	2.8K	4.4%	2.5%	53 tps	1.6s	131K	$0.59	$5.70
135	Qwen 2.5 VL 32B Instruct	1001	±21	865	4.9%	6.3%	43 tps	3.2s	128K	$0.35	$0.62
136	DeepSeek-R1 Turbo	1003	±9	2.5K	5.6%	2.6%	29 tps	1.8s	64K	$2.85	$4.75
137	Qwen3 Coder Plus	1007	±22	610	4.7%	5.1%	56 tps	2.3s	128K	$1.80	$9.80
138	Qwen3 VL 235B A22B Thinking	1009	±6	4.6K	8.3%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
139	Nemotron 3 Nano (Thinking)	1012	±13	2K	6.7%	2.0%	200 tps	0.5s	256K	$0	$0
140	Gemini 2.0 Flash	1018	±7	8.2K	3.8%	<0.1%	76 tps	0.5s	1M	$0.14	$0.56
141	OpenAI o3	1020	±7	5.9K	4.0%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
142	DeepSeek V3.1 Nex N1	1021	±19	565	5.0%	3.4%	24 tps	7.2s	131K	$0.14	$0.50
143	Command A	1024	±4	22.4K	4.8%	2.2%	42 tps	0.8s	256K	$2.00	$7.33
144	Amazon Nova 2 Lite	1026	±10	3.6K	6.0%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
145	Gemini 2.0 Flash Lite	1029	±5	14.7K	9.5%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
146	DeepSeek V3.2 Speciale	1030	±10	2.3K	6.1%	6.0%	43 tps	1.4s	131K	$0.84	$1.52
147	DeepSeek V3	1032	±5	17.6K	3.7%	0.9%	69 tps	1.1s	64K	$0.59	$1.49
148	Qwen3 VL 30B A3B Instruct	1034	±15	1K	6.7%	1.8%	80 tps	2.6s	129K	$0.18	$0.67
149	Gemini 3.1 Flash Lite Preview	1034	±21	980	4.4%	1.0%	8 tps	1.2s	1M	$0.25	$1.50
150	Gemini 2.5 Flash Lite Thinking Preview 0925	1035	±7	5.8K	6.8%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
151	Qwen3 Next 80B A3B Thinking	1035	±5	6.2K	7.4%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
152	QwQ 32B	1035	±4	11.6K	6.4%	5.4%	41 tps	2.1s	16K	$0.43	$0.56
153	Gemini 3.1 Flash Lite Preview Thinking	1039	±16	1.4K	4.2%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
154	OpenAI o4-mini	1042	±5	8.5K	6.4%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
155	Kimi K2 Thinking	1042	±10	3.3K	5.1%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
156	GLM 4.5 AirX	1042	±15	1.1K	6.9%	3.3%	75 tps	1.2s	131K	$1.10	$4.50
157	Qwen3 32B	1044	±19	850	6.6%	3.9%	30 tps	3.1s	41K	$0.12	$0.42
158	Cogito v2.1 671B	1044	±19	1.2K	4.6%	0.8%	85 tps	0.5s	128K	$1.25	$1.25
159	ERNIE 4.5 300B A47B	1049	±4	13.5K	3.9%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
160	Qwen3 32B Fast	1052	±6	11.4K	5.2%	11.6%	30 tps	3.1s	41K	$0.10	$0.25

4of8

View All (286 models)