Leaderboard | Coding

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1117

Gemini 2.5 Flash Lite Preview 0925

1115

Qwen3 Max Thinking

1115

Gemini 2.5 Flash Preview 0925

1115

Gemini 2.5 Flash

1113

DeepSeek V3 0324

1111

DeepSeek V3 0324 Turbo

1108

DeepSeek V3.1 Chat

1104

GPT-5.1 Codex Mini (Medium)

1101

Nova Experimental Chat 12-10

1095

Qwen3.5 35B A3B

1091

Qwen3 Omni 30B A3B Thinking

1090

GPT-4o

1086

GPT-4.1 nano

1085

Qwen3 Coder 480B A35B Instruct

1085

Gemini 3.1 Flash Lite Preview Thinking

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	77	Gemini 2.5 Flash Lite Preview 0925	1117	±8	4.3K	7.4%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
82	105	Qwen3 Max Thinking	1115	±23	945	2.1%	13.5%	32 tps	2.3s	256K	$1.20	$6.00
83	74	Gemini 2.5 Flash Preview 0925	1115	±11	4.1K	6.8%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
84	98	Gemini 2.5 Flash	1115	±5	17.3K	3.5%	1.3%	2 tps	3.7s	1M	$0.30	$2.50
85	90	DeepSeek V3 0324	1113	±7	7.7K	5.1%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
86	98	DeepSeek V3 0324 Turbo	1111	±5	6.5K	6.3%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
87	85	DeepSeek V3.1 Chat	1108	±12	2.4K	9.3%	2.8%	21 tps	1.6s	131K	$0.38	$1.00
88	119	GPT-5.1 Codex Mini (Medium)	1104	±15	1.6K	4.6%	4.6%	69 tps	4.1s	400K	$0.25	$2.00
89	49	Nova Experimental Chat 12-10	1101	±15	1.4K	5.3%	2.4%	84 tps	12.9s	98K	$0	$0
90	69	Qwen3.5 35B A3B	1095	±30	675	3.6%	2.1%	116 tps	2.1s	256K	$0.63	$1.13
91	85	Qwen3 Omni 30B A3B Thinking	1091	±12	1.7K	6.5%	3.7%	67 tps	1.2s	66K	$0.97	$1.79
92	90	GPT-4o	1090	±8	6.5K	3.8%	1.0%	49 tps	2.4s	128K	$3.71	$12.57
93	105	GPT-4.1 nano	1086	±7	9.8K	4.1%	0.6%	175 tps	0.5s	1M	$0.10	$0.40
94	90	Qwen3 Coder 480B A35B Instruct	1085	±14	1.8K	4.0%	3.3%	61 tps	2.0s	262K	$0.71	$1.34
95	128	Gemini 3.1 Flash Lite Preview Thinking	1085	±31	1.1K	4.0%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
96	98	OpenAI o3-pro	1085	±15	2.8K	3.8%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
97	90	Gemini 2.5 Flash Lite	1083	±7	11.8K	6.9%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
98	105	Qwen3 Omni 30B A3B Instruct	1083	±21	600	4.0%	3.9%	65 tps	1.2s	66K	$0.35	$0.97
99	85	GPT-5 Mini Minimal	1082	±12	2.3K	9.3%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
100	98	DeepSeek V3.1	1078	±15	1.8K	4.8%	0.8%	197 tps	0.4s	164K	$0.55	$1.60
101	77	DeepSeek V3.1 Turbo	1068	±16	2.8K	6.1%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
102	119	GPT-5.1 Codex Mini (High)	1065	±19	1.9K	3.6%	5.9%	70 tps	4.6s	400K	$0.25	$2.00
103	77	Mistral Large 3	1065	±10	3.2K	5.6%	2.1%	51 tps	1.0s	256K	$0.50	$1.50
104	90	DeepSeek V3.2 Exp Chat	1065	±14	2.2K	9.0%	2.6%	29 tps	1.5s	131K	$0.27	$0.39
105	119	Gemini 2.5 Flash Lite Thinking	1064	±8	7.4K	6.8%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
106	112	Kimi K2 Fast	1061	±5	16.4K	9.2%	0.8%	365 tps	0.5s	131K	$1.00	$3.00
107	148	Qwen3 VL 235B A22B Thinking	1055	±12	2.5K	9.4%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
108	105	Mistral Medium	1053	±7	5.5K	4.6%	1.8%	48 tps	0.6s	33K	$1.48	$4.55
109	128	Cogito v2.1 671B	1053	±21	920	5.2%	0.8%	85 tps	0.5s	128K	$1.25	$1.25
110	98	Qwen3 235B A22B	1050	±9	3.5K	8.8%	5.3%	71 tps	0.9s	41K	$0.23	$0.63
111	135	Gemini 2.0 Flash Lite	1050	±8	9.1K	3.4%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
112	112	Kimi K2 0905 Turbo	1050	±13	3.2K	13.0%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
113	112	Kimi K2 0905	1047	±13	1.8K	8.5%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
114	105	GPT-4.1 mini	1046	±8	8.7K	4.0%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
115	98	DeepSeek V3.2 Exp Thinking	1046	±17	1.7K	6.2%	7.2%	26 tps	3.0s	131K	$0.28	$0.42
116	128	Qwen3 32B	1046	±34	535	7.8%	3.9%	30 tps	3.1s	41K	$0.12	$0.42
117	128	ERNIE 4.5 300B A47B	1044	±7	8.7K	3.6%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
118	135	Qwen3 Next 80B A3B Thinking	1043	±15	2.7K	11.3%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
119	119	Qwen3 32B Fast	1043	±10	6.6K	6.4%	11.6%	30 tps	3.1s	41K	$0.10	$0.25
120	135	Qwen3 VL 30B A3B Instruct	1042	±21	860	7.0%	1.8%	80 tps	2.6s	129K	$0.18	$0.67

3of7

View All (273 models)