Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Language

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1110

Qwen Plus 0728

1110

Gemini 2.5 Flash Preview 0925

1110

Grok 4 Fast Non-Reasoning

1109

Claude Sonnet 3.5 v2

1108

Mistral Large 3

1108

GPT-5 Mini Low

1108

Qwen3 30B A3B Instruct 2507

1108

GPT-4.5 Preview

1106

DeepSeek V3.1 Turbo

1104

Gemini 2.5 Flash Lite Thinking Preview 0925

1102

Grok 3

1102

Claude Sonnet 4

1100

DeepSeek V3.1 Terminus Chat

1100

Gemini 2.5 Pro Preview 0325

1098

Gemini 2.5 Flash

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	33	Qwen Plus 0728	1110	±10	1.7K	9.8%	<0.1%	55 tps	0.9s	1M	$0.40	$1.20
82	60	Gemini 2.5 Flash Preview 0925	1110	±4	6.7K	7.5%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
83	52	Grok 4 Fast Non-Reasoning	1110	±5	7.1K	8.3%	1.5%	93 tps	0.6s	2M	$0.27	$0.67
84	106	Claude Sonnet 3.5 v2	1109	±7	2.9K	8.2%	<0.1%	46 tps	1.4s	200K	$3.00	$15.00
85	65	Mistral Large 3	1108	±7	4K	6.3%	2.1%	51 tps	1.0s	256K	$0.50	$1.50
86	108	GPT-5 Mini Low	1108	±4	2.5K	9.0%	<0.1%	69 tps	3.2s	400K	$0.25	$2.00
87	33	Qwen3 30B A3B Instruct 2507	1108	±5	8.5K	9.7%	1.2%	55 tps	1.3s	131K	$0.13	$0.72
88	77	GPT-4.5 Preview	1108	±10	1.7K	2.1%	<0.1%	36 tps	3.0s	200K	$75.00	$150.00
89	56	DeepSeek V3.1 Turbo	1106	±9	2.6K	5.1%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
90	95	Gemini 2.5 Flash Lite Thinking Preview 0925	1104	±5	4.9K	7.8%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
91	106	Grok 3	1102	±5	9.3K	9.3%	1.5%	53 tps	0.6s	1M	$3.67	$18.33
92	86	Claude Sonnet 4	1102	±4	18.3K	7.0%	1.8%	49 tps	1.3s	200K	$3.00	$15.00
93	44	DeepSeek V3.1 Terminus Chat	1100	±4	5.1K	9.6%	3.4%	27 tps	1.5s	131K	$0.86	$1.80
94	159	Gemini 2.5 Pro Preview 0325	1100	±18	475	5.0%	<0.1%	3 tps	16.6s	1M	$1.25	$10.00
95	95	Gemini 2.5 Flash	1098	±5	21.4K	5.2%	1.3%	2 tps	3.7s	1M	$0.30	$2.50
96	179	Switchpoint Router	1097	±11	1.1K	9.5%	1.7%	71 tps	4.9s	131K	$0.85	$3.40
97	71	Seed 1.8 251228	1096	±6	4.1K	3.4%	3.7%	41 tps	2.1s	256K	$0.25	$2.00
98	106	DeepSeek V3 0324	1090	±5	9.7K	8.2%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
99	113	Mistral Medium	1087	±4	5.3K	9.0%	1.8%	48 tps	0.6s	33K	$1.48	$4.55
100	62	MiniMax M2	1087	±6	16.5K	5.2%	2.2%	39 tps	2.3s	205K	$0.21	$0.85
101	48	gpt-oss-120b	1086	±4	15.1K	7.5%	0.7%	213 tps	0.5s	131K	$0.11	$0.50
102	62	Qwen3 Omni 30B A3B Instruct	1085	±14	570	6.6%	3.9%	65 tps	1.2s	66K	$0.35	$0.97
103	86	DeepSeek V3.1 Chat	1084	±6	3.7K	10.1%	2.8%	21 tps	1.6s	131K	$0.38	$1.00
104	81	Qwen3.5 27B	1082	±26	550	2.7%	3.7%	55 tps	2.6s	256K	$0.30	$2.40
105	48	Step 3.5 Flash	1079	±23	645	2.3%	2.2%	109 tps	0.6s	256K	$0.05	$0.15
106	65	DeepSeek V3.2 Exp Chat	1079	±4	4.3K	8.8%	2.6%	29 tps	1.5s	131K	$0.27	$0.39
107	93	Qwen Max	1077	±5	8.8K	9.1%	1.5%	49 tps	1.5s	33K	$1.60	$6.40
108	182	GLM 4.6 FP8	1076	±10	850	16.7%	<0.1%	56 tps	1.8s	200K	$0.40	$1.75
109	37	Nova Experimental Chat 10-20	1076	±4	3.6K	11.6%	<0.1%	30 tps	0.5s	98K	$0	$0
110	86	Qwen3 235B A22B	1074	±10	2.8K	14.4%	5.3%	71 tps	0.9s	41K	$0.23	$0.63
111	71	Gemini 2.5 Flash Lite Preview 0925	1070	±5	6.7K	8.6%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
112	95	Qwen3 32B	1070	±18	620	7.5%	3.9%	30 tps	3.1s	41K	$0.12	$0.42
113	95	Kimi K2 Thinking	1064	±12	1.6K	6.8%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
114	95	DeepSeek V3.2 Exp Thinking	1063	±8	5K	3.4%	7.2%	26 tps	3.0s	131K	$0.28	$0.42
115	48	OpenAI o1-mini	1062	±4	6.2K	12.1%	<0.1%	118 tps	N/A	128K	$1.13	$4.51
116	118	GPT-4.1 mini	1060	±4	11.7K	6.8%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
117	113	Gemini 2.5 Flash Lite Thinking	1059	±5	6.6K	9.5%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
118	93	DeepSeek V3 0324 Turbo	1055	±5	9.3K	10.3%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
119	71	Qwen3.5 397B A17B	1055	±11	1.6K	2.1%	4.3%	57 tps	1.4s	256K	$0.52	$3.00
120	139	Seed 2.0 Mini (Medium)	1053	±21	605	4.0%	11.9%	33 tps	1.7s	256K	$0.15	$0.60

3of8

View All (312 models)