Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Language

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1504

Claude Opus 4.6 (Thinking)

1445

Claude Opus 4.6

1371

GPT-5.4

1364

Claude Sonnet 4.6

1359

Gemini 3.1 Pro

1324

Claude Sonnet 4.6 (Thinking)

1282

Gemini 3 Pro

1280

Claude Opus 4.5 (Thinking)

1278

GPT-5.1

1273

GPT-5.1 (High)

1266

Gemini 3 Pro (Low)

1264

Claude Sonnet 4.5 (Thinking)

1254

GPT-5.2 Instant

1231

GLM 5

1228

Claude Sonnet 4 (Thinking)

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
1	1	Claude Opus 4.6 (Thinking)	1504	±9	3.2K	1.5%	2.5%	56 tps	1.6s	200K	$5.00	$25.00
2	2	Claude Opus 4.6	1445	±8	4.3K	1.2%	2.1%	48 tps	1.7s	200K	$5.00	$25.00
3	2	GPT-5.4	1371	±13	1.1K	1.3%	2.6%	55 tps	0.8s	1M	$2.50	$15.00
4	4	Claude Sonnet 4.6	1364	±8	3K	1.1%	1.6%	47 tps	1.2s	200K	$3.00	$15.00
5	6	Gemini 3.1 Pro	1359	±9	5.8K	2.3%	3.5%	35 tps	4.1s	1M	$2.00	$12.00
6	5	Claude Sonnet 4.6 (Thinking)	1324	±9	3K	2.6%	4.7%	57 tps	1.1s	200K	$3.00	$15.00
7	10	Gemini 3 Pro	1282	±4	37.7K	3.1%	2.1%	50 tps	3.6s	1M	$2.00	$12.00
8	7	Claude Opus 4.5 (Thinking)	1280	±4	23K	2.2%	1.8%	49 tps	1.4s	200K	$5.00	$25.00
9	8	GPT-5.1	1278	±5	8.5K	4.7%	2.3%	71 tps	1.4s	400K	$1.42	$11.33
10	8	GPT-5.1 (High)	1273	±4	16.6K	4.0%	3.2%	76 tps	6.9s	400K	$1.25	$10.00
11	14	Gemini 3 Pro (Low)	1266	±5	8.4K	4.6%	2.4%	51 tps	3.5s	1M	$2.00	$12.00
12	10	Claude Sonnet 4.5 (Thinking)	1264	±2	25.1K	4.5%	1.9%	44 tps	1.1s	200K	$3.00	$15.00
13	10	GPT-5.2 Instant	1254	±5	9K	3.9%	1.7%	52 tps	2.0s	400K	$1.75	$14.00
14	22	GLM 5	1231	±12	2.3K	2.5%	3.4%	36 tps	2.7s	200K	$0.72	$2.55
15	48	Claude Sonnet 4 (Thinking)	1228	±6	5.2K	3.4%	1.5%	52 tps	1.5s	200K	$3.00	$13.67
16	17	Gemini 3 Flash Preview	1226	±6	5.3K	4.2%	1.3%	138 tps	1.4s	1M	$0.50	$3.00
17	14	Gemini 3 Flash Preview Thinking	1225	±6	13.8K	3.4%	1.6%	3 tps	6.2s	1M	$0.50	$3.00
18	17	GPT-5.2 (High)	1221	±4	19.4K	3.1%	6.7%	18 tps	16.3s	400K	$1.75	$14.00
19	37	Claude Sonnet 4.5	1219	±5	13.7K	6.6%	1.4%	41 tps	1.3s	200K	$1.80	$9.00
20	16	GPT-5.2	1219	±6	6.2K	3.8%	4.1%	18 tps	2.7s	400K	$1.75	$14.00
21	17	Grok 4.20 Beta Reasoning	1209	±21	850	1.7%	1.1%	77 tps	4.5s	2M	$2.00	$5.50
22	17	Claude Opus 4.5	1207	±5	6.6K	3.6%	1.5%	45 tps	1.5s	200K	$5.00	$25.00
23	56	Gemini 3.1 Flash Lite Preview Thinking	1199	±13	950	3.1%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
24	22	GPT-5 Chat	1193	±3	23.9K	6.8%	1.3%	95 tps	0.9s	400K	$1.25	$10.00
25	13	GPT-5.3 Instant	1191	±8	2.2K	1.8%	0.9%	63 tps	0.8s	400K	$1.75	$14.00
26	42	GPT-5.2 (Extra High)	1189	±6	6.7K	3.5%	13.2%	17 tps	20.5s	400K	$1.75	$14.00
27	26	GPT-5 (High)	1171	±4	12K	3.7%	4.5%	81 tps	35.9s	400K	$1.25	$10.00
28	32	Gemini 2.5 Pro High	1169	±4	16.8K	7.8%	1.5%	48 tps	2.3s	1M	$1.25	$10.00
29	44	Gemini 2.5 Pro	1168	±4	19.1K	9.1%	2.3%	45 tps	2.6s	1M	$1.25	$10.00
30	86	Seed 2.0 Lite (Medium)	1166	±14	575	2.5%	6.6%	33 tps	1.6s	256K	$0.25	$2.00
31	71	MiniMax M2.5 FP8	1162	±17	575	3.4%	3.6%	33 tps	1.7s	205K	$0.45	$1.75
32	29	Qwen3 VL 235B A22B Instruct	1161	±6	4.5K	8.8%	3.1%	75 tps	1.9s	129K	$0.37	$1.81
33	56	MiniMax M2.1 Lightning	1157	±13	970	1.0%	1.7%	52 tps	2.1s	205K	$0.30	$2.40
34	71	Gemini 2.5 Flash Thinking	1153	±7	3.7K	3.6%	2.2%	88 tps	6.4s	1M	$0.30	$2.50
35	26	Claude Haiku 4.5 (Extended Thinking)	1152	±5	7K	6.6%	1.4%	115 tps	0.7s	200K	$1.00	$5.00
36	42	Qwen3 Max Instruct Preview	1150	±4	13.5K	5.8%	1.1%	31 tps	1.7s	256K	$1.43	$6.61
37	60	MiniMax M2.1	1149	±6	10.4K	4.3%	2.1%	66 tps	2.6s	205K	$0.30	$1.20
38	44	Grok 4.1 Fast Reasoning	1149	±6	21.2K	4.2%	1.5%	58 tps	7.3s	2M	$0.20	$0.50
39	40	Qwen3 235B A22B Instruct 2507	1146	±3	8.8K	12.2%	6.8%	13 tps	1.9s	262K	$0.13	$0.52
40	33	Grok 4.20 Multi Agent Beta	1143	±16	765	1.9%	1.2%	56 tps	8.8s	2M	$2.00	$6.00

1of5

View All (170 models)