Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Topics

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

659

OpenAI o3-mini-low

676

OpenAI o3-mini

722

Llama 4 Scout

767

Qwen3 Next 80B A3B Thinking

768

OpenAI o4-mini

804

Gemini 2.5 Flash Lite Thinking

824

GPT-4.1 nano

836

GPT-5 Nano

843

DeepSeek V3 0324 Turbo

854

OpenAI o4-mini-high

856

Gemini 2.0 Flash Lite

859

Gemini 2.5 Flash Lite Thinking Preview 0925

870

GPT-5 Mini

872

Grok 3

881

Kimi K2 0905 Turbo

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
1	175	OpenAI o3-mini-low	659	±21	505	2.9%	0.7%	139 tps	1.5s	200K	$1.10	$4.40
2	177	OpenAI o3-mini	676	±27	690	1.4%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
3	160	Llama 4 Scout	722	±33	700	2.1%	0.6%	88 tps	5.1s	131K	$0.18	$0.46
4	157	Qwen3 Next 80B A3B Thinking	767	±23	810	2.4%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
5	139	OpenAI o4-mini	768	±32	545	0.9%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
6	113	Gemini 2.5 Flash Lite Thinking	804	±18	775	3.1%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
7	133	GPT-4.1 nano	824	±22	735	2.0%	0.6%	175 tps	0.5s	1M	$0.10	$0.40
8	157	GPT-5 Nano	836	±34	685	4.2%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
9	93	DeepSeek V3 0324 Turbo	843	±21	635	0.8%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
10	148	OpenAI o4-mini-high	854	±22	560	1.8%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
11	143	Gemini 2.0 Flash Lite	856	±24	585	3.3%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
12	95	Gemini 2.5 Flash Lite Thinking Preview 0925	859	±16	1.2K	2.5%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
13	71	GPT-5 Mini	870	±15	940	4.1%	2.6%	66 tps	14.2s	400K	$0.25	$2.00
14	106	Grok 3	872	±26	745	1.3%	1.5%	53 tps	0.6s	1M	$3.67	$18.33
15	124	Kimi K2 0905 Turbo	881	±17	710	2.1%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
16	129	DeepSeek V3.1 Thinking	886	±16	510	2.9%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
17	62	MiniMax M2	900	±24	720	2.7%	2.2%	39 tps	2.3s	205K	$0.21	$0.85
18	118	GPT-4.1 mini	900	±16	950	1.0%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
19	106	DeepSeek V3 0324	920	±25	570	0.9%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
20	126	Qwen3 VL 235B A22B Thinking	922	±19	645	3.0%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
21	79	Qwen3 Max Thinking Preview	925	±26	530	1.9%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
22	81	GPT-4o	945	±31	505	3.8%	1.0%	49 tps	2.4s	128K	$3.71	$12.57
23	71	Gemini 2.5 Flash Lite Preview 0925	948	±16	1.1K	2.2%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
24	101	Gemini 2.5 Flash Lite	948	±16	1.6K	2.7%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
25	84	GPT-5 Mini Minimal	953	±16	595	3.3%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
26	52	GPT-5	957	±20	1.6K	2.9%	3.1%	78 tps	23.1s	400K	$1.25	$9.67
27	56	DeepSeek V3.1 Turbo	969	±37	665	1.5%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
28	93	Qwen Max	979	±19	695	2.1%	1.5%	49 tps	1.5s	33K	$1.60	$6.40
29	68	GLM 4.7	992	±33	635	2.3%	5.8%	40 tps	1.5s	200K	$0.77	$1.73
30	71	Gemini 2.5 Flash Thinking	1000	±18	1K	1.9%	2.2%	88 tps	6.4s	1M	$0.30	$2.50
31	86	Claude Sonnet 4	1011	±19	1.8K	1.4%	1.8%	49 tps	1.3s	200K	$3.00	$15.00
32	44	Grok 4.1 Fast Reasoning	1016	±18	1.4K	2.0%	1.5%	58 tps	7.3s	2M	$0.20	$0.50
33	48	Grok 4 Fast Reasoning	1022	±14	1.2K	2.0%	2.1%	102 tps	3.1s	2M	$0.30	$0.75
34	68	Grok 4	1022	±10	2.1K	2.5%	3.9%	29 tps	11.1s	256K	$3.00	$15.00
35	52	Grok 4 Fast Non-Reasoning	1023	±16	870	1.7%	1.5%	93 tps	0.6s	2M	$0.27	$0.67
36	26	Grok 4.1 Fast Non-Reasoning	1023	±21	820	1.8%	0.9%	101 tps	0.5s	2M	$0.20	$0.50
37	60	Gemini 2.5 Flash Preview 0925	1025	±13	1.2K	2.0%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
38	60	MiniMax M2.1	1036	±22	695	1.4%	2.1%	66 tps	2.6s	205K	$0.30	$1.20
39	37	Claude Sonnet 4.5	1040	±8	2K	3.2%	1.4%	41 tps	1.3s	200K	$1.80	$9.00
40	62	GPT-5.1 Instant	1040	±13	915	2.7%	1.3%	50 tps	1.9s	400K	$1.25	$10.00

1of2

View All (74 models)