Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Topics

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1021

DeepSeek-R1 Turbo

1021

Qwen Max

1020

Qwen3 Max Thinking Preview

1018

DeepSeek V3.1 Chat

1014

Kimi K2 0905

1014

Gemini 2.5 Flash Lite

1013

Amazon Nova 2 Lite

1005

GPT-5 Mini Low

1003

Grok 3

1002

Kimi K2 0711

999

DeepSeek V3.2 Exp Thinking

996

Gemini 2.5 Flash Lite Thinking

991

Kimi K2 0905 Turbo

990

DeepSeek V3 0324

989

Kimi K2 Fast

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	95	DeepSeek-R1 Turbo	1021	±13	485	3.0%	2.6%	29 tps	1.8s	64K	$2.85	$4.75
82	93	Qwen Max	1021	±14	1.8K	2.7%	1.5%	49 tps	1.5s	33K	$1.60	$6.40
83	79	Qwen3 Max Thinking Preview	1020	±10	1.2K	2.4%	3.1%	40 tps	2.1s	256K	$1.20	$6.00
84	86	DeepSeek V3.1 Chat	1018	±12	1.1K	3.1%	2.8%	21 tps	1.6s	131K	$0.38	$1.00
85	133	Kimi K2 0905	1014	±13	810	2.4%	4.0%	30 tps	1.4s	262K	$0.63	$2.39
86	101	Gemini 2.5 Flash Lite	1014	±9	5.3K	3.9%	1.3%	210 tps	0.7s	1M	$0.10	$0.40
87	86	Amazon Nova 2 Lite	1013	±18	815	4.7%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
88	108	GPT-5 Mini Low	1005	±16	735	3.9%	<0.1%	69 tps	3.2s	400K	$0.25	$2.00
89	106	Grok 3	1003	±9	2K	2.6%	1.5%	53 tps	0.6s	1M	$3.67	$18.33
90	170	Kimi K2 0711	1002	±15	720	3.4%	1.6%	29 tps	1.3s	131K	$0.72	$2.60
91	95	DeepSeek V3.2 Exp Thinking	999	±22	775	1.9%	7.2%	26 tps	3.0s	131K	$0.28	$0.42
92	113	Gemini 2.5 Flash Lite Thinking	996	±11	2.5K	3.7%	1.0%	118 tps	4.4s	1M	$0.03	$0.13
93	124	Kimi K2 0905 Turbo	991	±12	1.6K	1.8%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
94	106	DeepSeek V3 0324	990	±11	2.1K	3.0%	5.8%	12 tps	2.7s	164K	$0.38	$0.93
95	113	Kimi K2 Fast	989	±10	7.4K	2.2%	0.8%	365 tps	0.5s	131K	$1.00	$3.00
96	86	Qwen3 235B A22B	989	±19	740	3.9%	5.3%	71 tps	0.9s	41K	$0.23	$0.63
97	113	Mistral Medium	989	±14	1.1K	2.7%	1.8%	48 tps	0.6s	33K	$1.48	$4.55
98	44	Kimi K2 Thinking Turbo	986	±14	1.1K	3.2%	2.0%	75 tps	1.4s	262K	$1.15	$8.00
99	95	Kimi K2 Thinking	985	±21	620	3.1%	4.2%	61 tps	5.9s	262K	$0.24	$1.03
100	106	DeepSeek V3.1 Terminus Thinking	979	±13	660	3.6%	5.9%	27 tps	1.8s	131K	$0.56	$1.68
101	118	GPT-4.1 mini	976	±13	2.7K	1.8%	1.1%	67 tps	0.9s	1M	$0.34	$1.60
102	113	GLM 4.5	969	±19	1.3K	3.5%	3.7%	46 tps	1.4s	131K	$0.43	$1.63
103	84	GPT-5 Mini Minimal	968	±17	795	3.6%	1.2%	63 tps	1.4s	400K	$0.25	$2.00
104	148	OpenAI o3	960	±16	600	2.4%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
105	129	DeepSeek V3.1 Thinking	958	±14	1K	2.4%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
106	56	DeepSeek V3.1 Turbo	957	±14	820	4.1%	0.9%	173 tps	1.3s	164K	$2.00	$3.75
107	126	DeepSeek V3	956	±12	1.7K	2.5%	0.9%	69 tps	1.1s	64K	$0.59	$1.49
108	148	OpenAI o4-mini-high	950	±12	1.5K	3.8%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
109	68	GLM 4.7	949	±13	1.6K	1.8%	5.8%	40 tps	1.5s	200K	$0.77	$1.73
110	71	Seed 1.8 251228	949	±18	1.2K	2.7%	3.7%	41 tps	2.1s	256K	$0.25	$2.00
111	129	Command A	948	±12	1.9K	3.1%	2.2%	42 tps	0.8s	256K	$2.00	$7.33
112	139	OpenAI o4-mini	947	±11	1.2K	2.5%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
113	133	Qwen3 14B	943	±16	825	4.1%	1.7%	109 tps	0.8s	41K	$0.04	$0.15
114	126	Qwen3 VL 235B A22B Thinking	939	±15	965	3.5%	4.3%	47 tps	3.0s	127K	$0.47	$3.31
115	133	Solar Pro 2 250710	938	±10	1.7K	3.9%	<0.1%	9 tps	N/A	66K	$0.50	$0.50
116	148	DeepSeek-R1	936	±21	705	4.1%	0.8%	133 tps	0.6s	64K	$0.91	$3.07
117	147	GLM 4.5 Air	932	±16	1.6K	3.5%	<0.1%	22 tps	1.4s	131K	$0.10	$0.38
118	153	OpenAI o1	926	±15	915	2.1%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
119	101	gpt-oss-20b	912	±12	1.5K	4.1%	0.5%	216 tps	0.5s	131K	$0.06	$0.26
120	65	DeepSeek V3.2 Exp Chat	909	±11	1.3K	2.6%	2.6%	29 tps	1.5s	131K	$0.27	$0.39

3of4

View All (159 models)