Leaderboard | Coding

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1161

Gemini 2.5 Flash Preview

1158

GPT-5 (Minimal)

1158

DeepSeek V3.1 Terminus Chat

1146

Qwen Plus (Aug'24)

1142

Qwen3.5 397B A17B

1140

Gemini 2.5 Flash Preview 0925

1136

Gemini 2.5 Flash Preview Thinking

1131

GPT-5 Mini

1130

DeepSeek V3.1 Turbo

1129

Grok 4.20 Multi Agent Beta

1127

Qwen3 Max Thinking Preview

1125

Grok 4

1125

Ministral 8B 2512

1123

GPT-4.1

1122

Gemini 2.5 Flash Lite Preview 0925

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	86	Gemini 2.5 Flash Preview	1161	±8	3K	1.1%	<0.1%	138 tps	6.9s	1M	$0.15	$0.60
82	86	GPT-5 (Minimal)	1158	±5	8.3K	7.4%	<0.1%	67 tps	1.4s	400K	$1.25	$10.00
83	69	DeepSeek V3.1 Terminus Chat	1158	±5	6.5K	6.9%	3.4%	27 tps	1.5s	131K	$0.86	$1.80
84	74	Qwen Plus (Aug'24)	1146	±5	17.2K	4.7%	1.4%	53 tps	1.3s	30K	$0.40	$1.20
85	74	Qwen3.5 397B A17B	1142	±14	2.5K	2.9%	4.3%	57 tps	1.4s	256K	$0.52	$3.00
86	74	Gemini 2.5 Flash Preview 0925	1140	±6	7.6K	6.0%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
87	93	Gemini 2.5 Flash Preview Thinking	1136	±10	1.4K	1.8%	<0.1%	26 tps	1.8s	1M	$0.15	$1.76
88	77	GPT-5 Mini	1131	±5	8.6K	5.4%	2.6%	66 tps	14.2s	400K	$0.25	$2.00
89	77	DeepSeek V3.1 Turbo	1130	±7	4.8K	5.3%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
90	77	Grok 4.20 Multi Agent Beta	1129	±19	945	3.6%	1.2%	56 tps	8.8s	2M	$2.00	$6.00
91	77	Qwen3 Max Thinking Preview	1127	±10	6.3K	5.7%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
92	77	Grok 4	1125	±3	39.6K	4.4%	3.9%	29 tps	11.1s	256K	$3.00	$15.00
93	97	Ministral 8B 2512	1125	±15	510	7.3%	<0.1%	174 tps	0.5s	128K	$0.15	$0.15
94	77	GPT-4.1	1123	±5	32.8K	5.2%	3.7%	112 tps	1.3s	1M	$2.00	$8.00
95	77	Gemini 2.5 Flash Lite Preview 0925	1122	±7	8.5K	6.6%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
96	97	Gemini 2.5 Pro Preview 0605	1121	±10	1.7K	2.3%	<0.1%	0 tps	3.7s	1M	$1.25	$10.00
97	85	Gemini 2.5 Flash Thinking	1118	±4	13.7K	3.6%	2.2%	88 tps	6.4s	1M	$0.30	$2.50
98	85	GPT-5 Mini Minimal	1114	±12	3.2K	8.5%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
99	85	GPT-5.2 Codex (Low)	1113	±19	1.2K	3.2%	4.5%	41 tps	5.0s	400K	$1.75	$14.00
100	108	Gemini 2.5 Pro Preview 0325	1111	±11	1.5K	3.2%	<0.1%	3 tps	16.6s	1M	$1.25	$10.00
101	85	DeepSeek V3.1 Chat	1110	±7	4.9K	6.6%	2.8%	21 tps	1.6s	131K	$0.38	$1.00
102	85	Qwen3 Omni 30B A3B Thinking	1110	±10	2.3K	6.0%	3.7%	67 tps	1.2s	66K	$0.97	$1.79
103	90	Qwen Max	1107	±4	18.3K	4.2%	1.5%	49 tps	1.5s	33K	$1.60	$6.40
104	114	GPT-5 Mini Low	1104	±8	2.8K	7.2%	<0.1%	69 tps	3.2s	400K	$0.25	$2.00
105	90	Gemini 2.5 Flash Lite	1103	±5	21.3K	6.2%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
106	90	Grok 3 Fast	1102	±14	2.5K	4.7%	1.7%	52 tps	2.4s	131K	$5.00	$25.00
107	90	GPT-4o	1102	±5	8.5K	3.7%	1.0%	49 tps	2.4s	128K	$3.71	$12.57
108	90	DeepSeek V3 0324	1100	±4	15.1K	4.3%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
109	90	Qwen3 Coder 480B A35B Instruct	1099	±8	3.1K	4.5%	3.3%	61 tps	2.0s	262K	$0.71	$1.34
110	98	Gemini 2.5 Flash	1098	±4	35.9K	3.2%	1.3%	2 tps	3.7s	1M	$0.30	$2.50
111	98	Grok 3	1098	±4	19.1K	5.5%	1.5%	53 tps	0.6s	1M	$3.67	$18.33
112	98	DeepSeek V3 0324 Turbo	1093	±5	15.5K	5.7%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
113	123	Nova Experimental Chat 10-09	1091	±7	3.2K	10.7%	<0.1%	59 tps	6.1s	98K	$0	$0
114	123	Sherlock Dash Alpha	1090	±19	835	6.7%	<0.1%	68 tps	0.7s	2M	$0	$0
115	98	OpenAI o3-pro	1090	±8	5.4K	4.3%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
116	98	DeepSeek V3.1	1089	±12	2.3K	4.7%	0.8%	197 tps	0.4s	164K	$0.55	$1.60
117	132	Claude Sonnet 3.5	1088	±10	2.9K	4.9%	1.0%	40 tps	2.7s	200K	$3.00	$15.00
118	132	Qwen Plus 0728 (Thinking)	1087	±9	1.2K	8.9%	<0.1%	56 tps	1.1s	1M	$0.40	$4.00
119	105	GPT-4.1 mini	1087	±5	19.7K	4.2%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
120	105	GPT-4.1 nano	1085	±5	17K	5.0%	0.6%	175 tps	0.5s	1M	$0.10	$0.40

3of8

View All (305 models)