Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Language

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

970

OpenAI o3

963

LongCat Flash Chat

960

OpenAI o1

958

OpenAI o4-mini-high

956

OpenAI o4-mini

955

DeepSeek V3.1 Thinking

952

Qwen3 Max Thinking Preview

951

OpenAI o3-pro

949

Qwen3.5 35B A3B

928

Seed 1.6 250615

926

Kimi K2 Thinking

925

Kimi K2 0905 Turbo

922

Kimi K2 0905

922

Qwen3 VL 235B A22B Thinking

918

ERNIE 4.5 300B A47B

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	148	OpenAI o3	970	±10	1.2K	3.1%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
82	111	LongCat Flash Chat	963	±25	560	4.3%	0.8%	85 tps	0.9s	131K	$0.14	$0.68
83	153	OpenAI o1	960	±11	2.3K	2.4%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
84	148	OpenAI o4-mini-high	958	±11	2.2K	3.1%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
85	139	OpenAI o4-mini	956	±16	1.4K	2.8%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
86	129	DeepSeek V3.1 Thinking	955	±14	1.1K	2.2%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
87	79	Qwen3 Max Thinking Preview	952	±20	1.1K	2.2%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
88	81	OpenAI o3-pro	951	±19	1.6K	3.4%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
89	101	Qwen3.5 35B A3B	949	±27	530	2.8%	2.1%	116 tps	2.1s	256K	$0.63	$1.13
90	143	Seed 1.6 250615	928	±21	635	5.2%	3.1%	46 tps	2.2s	256K	$0.25	$2.00
91	95	Kimi K2 Thinking	926	±17	740	2.0%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
92	124	Kimi K2 0905 Turbo	925	±13	1.5K	4.7%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
93	133	Kimi K2 0905	922	±21	805	4.2%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
94	126	Qwen3 VL 235B A22B Thinking	922	±18	745	4.5%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
95	119	ERNIE 4.5 300B A47B	918	±17	1.6K	2.7%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
96	143	Gemini 2.0 Flash Lite	917	±11	2.5K	6.7%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
97	62	MiniMax M2	905	±18	1.4K	3.5%	2.2%	39 tps	2.3s	205K	$0.21	$0.85
98	177	OpenAI o3-mini	901	±12	2.5K	3.1%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
99	139	Seed 2.0 Mini (Medium)	900	±30	515	3.7%	11.9%	33 tps	1.7s	256K	$0.15	$0.60
100	165	Qwen3 4B	878	±23	735	3.9%	1.9%	94 tps	1.5s	128K	$0.01	$0.01
101	160	Llama 4 Scout	875	±15	2.3K	2.9%	0.6%	88 tps	5.1s	131K	$0.18	$0.46
102	179	GLM 4.7 Flash	874	±24	855	2.8%	5.8%	61 tps	2.8s	128K	$0.07	$0.39
103	214	OpenAI o3-mini-high	868	±13	1.4K	3.8%	2.4%	231 tps	10.5s	200K	$1.10	$4.40
104	129	Qwen3 Max Thinking	866	±14	1.5K	1.7%	13.5%	32 tps	2.3s	256K	$1.20	$6.00
105	139	GLM 4.6V	865	±24	890	2.7%	6.4%	21 tps	1.8s	128K	$0.38	$0.90
106	170	Kimi K2 0711	858	±24	890	4.3%	1.6%	29 tps	1.3s	131K	$0.72	$2.60
107	157	Qwen3 Next 80B A3B Thinking	846	±15	1.3K	3.9%	0.6%	175 tps	1.3s	256K	$0.21	$2.26
108	157	GPT-5 Nano	843	±14	2K	6.0%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
109	175	OpenAI o3-mini-low	838	±21	1.7K	2.6%	0.7%	139 tps	1.5s	200K	$1.10	$4.40
110	84	GPT-5 Mini Minimal	835	±13	1.1K	6.6%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
111	186	Grok 3 Mini Fast	832	±23	1K	3.3%	1.6%	44 tps	0.5s	131K	$0.60	$4.00
112	133	DeepSeek V3.2 Speciale	830	±28	540	3.6%	6.0%	43 tps	1.4s	131K	$0.84	$1.52
113	161	Qwen3 8B	827	±36	600	4.0%	2.4%	61 tps	1.4s	41K	$0.02	$0.07
114	201	GPT-4o mini	826	±18	645	6.5%	2.1%	71 tps	1.7s	128K	$0.15	$0.60
115	148	Qwen3 30B A3B Thinking 2507	818	±18	795	3.0%	0.5%	124 tps	1.2s	131K	$0.16	$1.70
116	265	Qwen 2.5 VL 72B Instruct	804	±29	715	6.5%	5.3%	25 tps	3.7s	128K	$1.01	$2.79
117	229	Magistral Medium 2509	797	±17	570	5.0%	4.0%	58 tps	0.9s	131K	$2.00	$5.00
118	265	Magistral Small 2509	790	±29	530	6.2%	2.7%	116 tps	0.6s	131K	$0.50	$1.50
119	186	Gemma 3n E4B	781	±27	535	4.5%	2.0%	30 tps	0.5s	8K	$0.01	$0.02
120	194	Llama 3.3 70B	745	±30	525	4.5%	0.3%	500 tps	0.5s	8K	$0.48	$0.66

3of4

View All (121 models)