Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Topics

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

1063

Qwen3 Max Instruct Preview

1066

Claude Sonnet 4

1066

Gemini 2.5 Flash Lite Preview 0925

1074

DeepSeek V3 0324 Turbo

1075

GPT-5.1 Instant

1075

GPT-5 Mini

1076

Grok 4.1 Fast Reasoning

1083

gpt-oss-120b

1083

Kimi K2.5

1083

Gemini 3.1 Flash Lite Preview Thinking

1090

Grok 4 Fast Reasoning

1093

Grok 4

1098

Gemini 2.5 Flash

1101

Kimi K2.5 Instant

1110

GPT-5 (High)

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
81	42	Qwen3 Max Instruct Preview	1063	±7	2.7K	1.5%	1.1%	31 tps	1.7s	256K	$1.43	$6.61
82	86	Claude Sonnet 4	1066	±8	5.3K	2.5%	1.8%	49 tps	1.3s	200K	$3.00	$15.00
83	71	Gemini 2.5 Flash Lite Preview 0925	1066	±11	2.2K	2.8%	1.2%	209 tps	0.7s	1M	$0.25	$0.35
84	93	DeepSeek V3 0324 Turbo	1074	±14	2.1K	1.9%	6.3%	12 tps	2.4s	164K	$0.73	$1.79
85	62	GPT-5.1 Instant	1075	±9	2.2K	2.6%	1.3%	50 tps	1.9s	400K	$1.25	$10.00
86	71	GPT-5 Mini	1075	±9	2.1K	4.3%	2.6%	66 tps	14.2s	400K	$0.25	$2.00
87	44	Grok 4.1 Fast Reasoning	1076	±10	2.6K	4.2%	1.5%	58 tps	7.3s	2M	$0.20	$0.50
88	48	gpt-oss-120b	1083	±7	3.5K	3.0%	0.7%	213 tps	0.5s	131K	$0.11	$0.50
89	33	Kimi K2.5	1083	±16	1.7K	3.2%	6.5%	33 tps	1.7s	262K	$0.34	$2.57
90	56	Gemini 3.1 Flash Lite Preview Thinking	1083	±32	485	3.0%	1.7%	75 tps	4.7s	1M	$0.25	$1.50
91	48	Grok 4 Fast Reasoning	1090	±11	2.1K	3.1%	2.1%	102 tps	3.1s	2M	$0.30	$0.75
92	68	Grok 4	1093	±5	5.7K	4.0%	3.9%	29 tps	11.1s	256K	$3.00	$15.00
93	95	Gemini 2.5 Flash	1098	±9	4.8K	2.7%	1.3%	2 tps	3.7s	1M	$0.30	$2.50
94	37	Kimi K2.5 Instant	1101	±28	495	1.0%	2.9%	32 tps	3.0s	262K	$0.50	$3.00
95	26	GPT-5 (High)	1110	±7	4.3K	3.1%	4.5%	81 tps	35.9s	400K	$1.25	$10.00
96	71	Qwen3.5 397B A17B	1112	±24	580	2.5%	4.3%	57 tps	1.4s	256K	$0.52	$3.00
97	29	Qwen3 VL 235B A22B Instruct	1114	±8	1.3K	2.5%	3.1%	75 tps	1.9s	129K	$0.37	$1.81
98	26	Claude Haiku 4.5 (Extended Thinking)	1115	±12	2.2K	2.7%	1.4%	115 tps	0.7s	200K	$1.00	$5.00
99	68	Qwen Plus (Aug'24)	1115	±8	1.9K	2.6%	1.4%	53 tps	1.3s	30K	$0.40	$1.20
100	40	Qwen3 235B A22B Instruct 2507	1118	±11	2.5K	2.1%	6.8%	13 tps	1.9s	262K	$0.13	$0.52
101	81	OpenAI o3-pro	1126	±10	2.3K	3.1%	5.2%	22 tps	70.8s	200K	$20.00	$80.00
102	33	Qwen3 30B A3B Instruct 2507	1127	±9	2.5K	2.9%	1.2%	55 tps	1.3s	131K	$0.13	$0.72
103	26	Grok 4.1 Fast Non-Reasoning	1130	±15	2K	4.3%	0.9%	101 tps	0.5s	2M	$0.20	$0.50
104	60	Gemini 2.5 Flash Preview 0925	1131	±10	2.1K	2.7%	1.2%	5 tps	0.9s	1M	$0.13	$0.97
105	29	Nova Experimental Chat 12-10	1135	±19	720	2.0%	2.4%	84 tps	12.9s	98K	$0	$0
106	33	Qwen3 Next 80B A3B Instruct	1142	±9	1.8K	2.5%	0.6%	84 tps	1.1s	256K	$0.20	$1.42
107	48	Claude Sonnet 4 (Thinking)	1144	±6	4.2K	3.5%	1.5%	52 tps	1.5s	200K	$3.00	$13.67
108	71	Gemini 2.5 Flash Thinking	1148	±7	2.6K	4.2%	2.2%	88 tps	6.4s	1M	$0.30	$2.50
109	37	Claude Sonnet 4.5	1156	±5	5.1K	2.8%	1.4%	41 tps	1.3s	200K	$1.80	$9.00
110	52	GPT-5	1157	±7	5.3K	2.9%	3.1%	78 tps	23.1s	400K	$1.25	$9.67
111	44	Gemini 2.5 Pro	1158	±5	7.8K	3.3%	2.3%	45 tps	2.6s	1M	$1.25	$10.00
112	13	GPT-5.3 Instant	1160	±19	1.5K	1.9%	0.9%	63 tps	0.8s	400K	$1.75	$14.00
113	42	GPT-5.2 (Extra High)	1168	±12	2.4K	1.8%	13.2%	17 tps	20.5s	400K	$1.75	$14.00
114	17	GPT-5.2 (High)	1175	±10	6.4K	1.7%	6.7%	18 tps	16.3s	400K	$1.75	$14.00
115	22	GLM 5	1184	±22	795	2.5%	3.4%	36 tps	2.7s	200K	$0.72	$2.55
116	32	Gemini 2.5 Pro High	1189	±6	4.5K	2.5%	1.5%	48 tps	2.3s	1M	$1.25	$10.00
117	17	Gemini 3 Flash Preview	1198	±14	2K	2.0%	1.3%	138 tps	1.4s	1M	$0.50	$3.00
118	14	Gemini 3 Flash Preview Thinking	1212	±8	4.2K	1.8%	1.6%	3 tps	6.2s	1M	$0.50	$3.00
119	16	GPT-5.2	1213	±12	2.7K	2.2%	4.1%	18 tps	2.7s	400K	$1.75	$14.00
120	22	GPT-5 Chat	1220	±6	10.4K	2.1%	1.3%	95 tps	0.9s	400K	$1.25	$10.00

3of4

View All (133 models)