Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Language

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1053

Seed 2.0 Mini (Medium)

1051

Grok 3 Fast

1048

OpenAI o3-pro

1047

Qwen3 Omni 30B A3B Thinking

1046

GLM 4.7 FP8

1044

Qwen3 Max Thinking Preview

1042

Seed 1.6 250615

1041

Kimi K2 0905 Turbo

1038

Gemini 2.0 Flash

1038

Gemini 2.5 Flash Lite

1037

OpenAI o1

1035

GPT-5 Nano

1034

DeepSeek V3 (Turbo)

1032

ERNIE 4.5 300B A47B

1029

DeepSeek V3.1

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	139	Seed 2.0 Mini (Medium)	1053	±21	605	4.0%	11.9%	33 tps	1.7s	256K	$0.15	$0.60
82	111	Grok 3 Fast	1051	±17	1.1K	2.6%	1.7%	52 tps	2.4s	131K	$5.00	$25.00
83	81	OpenAI o3-pro	1048	±8	2.2K	3.5%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
84	37	Qwen3 Omni 30B A3B Thinking	1047	±11	1.3K	5.9%	3.7%	67 tps	1.2s	66K	$0.97	$1.79
85	119	GLM 4.7 FP8	1046	±19	490	3.0%	6.9%	40 tps	1.3s	200K	$0.30	$1.20
86	79	Qwen3 Max Thinking Preview	1044	±5	5.1K	7.7%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
87	143	Seed 1.6 250615	1042	±13	1.2K	4.8%	3.1%	46 tps	2.2s	256K	$0.25	$2.00
88	124	Kimi K2 0905 Turbo	1041	±4	6.8K	12.4%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
89	143	Gemini 2.0 Flash	1038	±6	3.7K	8.9%	<0.1%	76 tps	0.5s	1M	$0.14	$0.56
90	101	Gemini 2.5 Flash Lite	1038	±5	12.8K	12.6%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
91	153	OpenAI o1	1037	±15	1.2K	4.8%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
92	157	GPT-5 Nano	1035	±6	3.8K	10.6%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
93	101	DeepSeek V3 (Turbo)	1034	±11	1K	5.9%	1.5%	32 tps	1.5s	64K	$0.40	$1.30
94	119	ERNIE 4.5 300B A47B	1032	±6	6.1K	8.7%	4.7%	23 tps	2.3s	123K	$0.28	$1.10
95	71	DeepSeek V3.1	1029	±10	1.1K	4.5%	0.8%	197 tps	0.4s	164K	$0.55	$1.60
96	86	Amazon Nova 2 Lite	1027	±10	2.6K	7.9%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
97	113	GLM 4.5 AirX	1020	±10	805	9.0%	3.3%	75 tps	1.2s	131K	$1.10	$4.50
98	133	GPT-4.1 nano	1020	±4	8.8K	9.7%	0.6%	175 tps	0.5s	1M	$0.10	$0.40
99	124	Qwen3 235B A22B Thinking 2507	1018	±11	1.1K	4.2%	2.5%	53 tps	1.6s	131K	$0.59	$5.70
100	148	OpenAI o3	1016	±11	1.3K	4.6%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
101	129	DeepSeek V3.1 Thinking	1014	±7	3.9K	14.0%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
102	143	Gemini 2.0 Flash Lite	1011	±6	5.7K	6.9%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
103	113	GLM 4.5	1002	±5	3.7K	14.3%	3.7%	46 tps	1.4s	131K	$0.43	$1.63
104	121	NVIDIA Llama 3.3 Nemotron Super 49B v1.5	1000	±16	1K	9.9%	2.0%	50 tps	0.6s	131K	$0.09	$0.33
105	139	OpenAI o4-mini	1000	±5	4.8K	10.2%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
106	111	LongCat Flash Chat	996	±14	930	7.0%	0.8%	85 tps	0.9s	131K	$0.14	$0.68
107	133	Kimi K2 0905	991	±6	7.5K	5.6%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
108	129	Qwen3 Max Thinking	990	±13	1.7K	2.3%	13.5%	32 tps	2.3s	256K	$1.20	$6.00
109	157	Cogito v2.1 671B	984	±17	715	5.9%	0.8%	85 tps	0.5s	128K	$1.25	$1.25
110	126	Qwen3 VL 235B A22B Thinking	979	±6	3.5K	11.5%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
111	165	DeepSeek R1T2 Chimera	978	±10	1.1K	11.0%	3.0%	28 tps	1.8s	164K	$0.13	$0.45
112	214	Qwen 2.5 VL 32B Instruct	977	±20	850	7.6%	6.3%	43 tps	3.2s	128K	$0.35	$0.62
113	209	Seed 1.6 Flash 250715	974	±16	980	6.2%	2.5%	108 tps	1.6s	256K	$0.07	$0.30
114	177	OpenAI o3-mini	946	±6	6.7K	12.3%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
115	153	Ministral 14B 3.0	945	±28	490	11.7%	2.0%	119 tps	0.5s	128K	$0.20	$0.20
116	170	Devstral Medium	945	±11	1.6K	14.7%	1.5%	77 tps	0.6s	131K	$0.40	$2.00
117	201	GPT-4o mini	939	±9	1.4K	9.2%	2.1%	71 tps	1.7s	128K	$0.15	$0.60
118	139	GLM 4.6V	938	±11	2.5K	6.1%	6.4%	21 tps	1.8s	128K	$0.38	$0.90
119	148	OpenAI o4-mini-high	937	±6	6K	14.9%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
120	175	OpenAI o3-mini-low	937	±4	6.1K	13.6%	0.7%	139 tps	1.5s	200K	$1.10	$4.40

3of5

View All (170 models)