Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Language

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

998

DeepSeek-R1 0528

992

Qwen3 8B

988

MiniMax M2.5 FP8

988

Gemini 2.0 Flash Lite

981

OpenAI o1

980

Llama 4 Maverick

978

Gemini 2.5 Flash Lite Thinking Preview 0925

972

Kimi K2 0905 Turbo

972

MiniMax M2.5 Lightning

970

Qwen3 4B

966

OpenAI o4-mini-high

966

Amazon Nova 2 Lite

963

OpenAI o3-mini-low

956

DeepSeek V3.1 Thinking

954

Llama 3.1 8B Turbo

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
121	133	DeepSeek-R1 0528	998	±4	4.9K	1.5%	1.3%	93 tps	0.5s	64K	$1.60	$3.67
122	161	Qwen3 8B	992	±8	3.1K	1.6%	2.4%	61 tps	1.4s	41K	$0.02	$0.07
123	71	MiniMax M2.5 FP8	988	±19	525	1.9%	3.6%	33 tps	1.7s	205K	$0.45	$1.75
124	143	Gemini 2.0 Flash Lite	988	±6	4.1K	2.6%	<0.1%	42 tps	0.5s	1M	$0.08	$0.30
125	153	OpenAI o1	981	±5	9.1K	1.7%	4.2%	92 tps	5.5s	200K	$15.00	$60.00
126	161	Llama 4 Maverick	980	±6	7.3K	1.8%	1.2%	88 tps	2.4s	1M	$0.23	$0.83
127	95	Gemini 2.5 Flash Lite Thinking Preview 0925	978	±7	2.2K	2.5%	1.5%	152 tps	3.0s	1M	$0.10	$0.40
128	124	Kimi K2 0905 Turbo	972	±7	3.2K	3.9%	0.7%	373 tps	0.5s	262K	$1.70	$6.50
129	79	MiniMax M2.5 Lightning	972	±17	935	1.1%	1.5%	51 tps	2.0s	205K	$0.60	$2.40
130	165	Qwen3 4B	970	±8	3.1K	2.7%	1.9%	94 tps	1.5s	128K	$0.01	$0.01
131	148	OpenAI o4-mini-high	966	±4	9.3K	1.8%	1.9%	117 tps	15.9s	200K	$1.10	$4.40
132	86	Amazon Nova 2 Lite	966	±9	1.6K	3.0%	1.0%	137 tps	0.6s	300K	$0.35	$2.95
133	175	OpenAI o3-mini-low	963	±8	8.8K	1.9%	0.7%	139 tps	1.5s	200K	$1.10	$4.40
134	129	DeepSeek V3.1 Thinking	956	±10	2.2K	2.4%	7.1%	18 tps	1.8s	131K	$0.23	$0.75
135	170	Llama 3.1 8B Turbo	954	±20	685	2.1%	2.1%	650 tps	0.5s	128K	$0.13	$0.14
136	170	Mistral Small 3.2 24B	953	±9	1.4K	1.8%	2.8%	141 tps	0.7s	33K	$0.02	$0.08
137	177	Mistral Small 3.1 24B Instruct	949	±16	745	2.0%	7.5%	15 tps	2.4s	131K	$0.06	$0.18
138	165	DeepSeek R1T2 Chimera	947	±20	620	2.4%	3.0%	28 tps	1.8s	164K	$0.13	$0.45
139	160	Llama 4 Scout	941	±7	6.9K	1.5%	0.6%	88 tps	5.1s	131K	$0.18	$0.46
140	179	GLM 4.7 Flash	939	±11	1.1K	1.3%	5.8%	61 tps	2.8s	128K	$0.07	$0.39
141	186	Grok 3 Mini Fast	939	±11	3.9K	2.3%	1.6%	44 tps	0.5s	131K	$0.60	$4.00
142	157	Cogito v2.1 671B	937	±15	885	1.7%	0.8%	85 tps	0.5s	128K	$1.25	$1.25
143	148	OpenAI o3	935	±5	4.3K	1.7%	0.9%	85 tps	6.8s	128K	$7.33	$29.33
144	161	DeepSeek Prover v2	933	±17	825	2.4%	5.2%	14 tps	1.3s	164K	$0.40	$1.56
145	214	Llama 3.3 70B Instruct Turbo	931	±27	505	3.8%	2.0%	78 tps	1.0s	131K	$0.88	$0.88
146	201	Gemma 3 27B IT	930	±15	655	2.2%	2.0%	60 tps	0.8s	128K	$0.17	$0.29
147	157	GPT-5 Nano	928	±10	1.8K	3.0%	3.2%	113 tps	20.9s	400K	$0.05	$0.40
148	170	Kimi K2 0711	928	±9	3.2K	2.2%	1.6%	29 tps	1.3s	131K	$0.72	$2.60
149	139	OpenAI o4-mini	925	±8	4K	2.3%	1.4%	97 tps	7.0s	128K	$1.10	$4.40
150	209	Seed 1.6 Flash 250715	922	±16	580	2.5%	2.5%	108 tps	1.6s	256K	$0.07	$0.30
151	214	OpenAI o3-mini-high	922	±6	7.5K	2.0%	2.4%	231 tps	10.5s	200K	$1.10	$4.40
152	177	OpenAI o3-mini	921	±6	9K	1.9%	0.8%	143 tps	3.3s	200K	$1.10	$4.40
153	214	Gemma 3 12B	921	±18	635	3.1%	4.2%	73 tps	0.8s	131K	$0.05	$0.12
154	186	Jamba 1.6 Large	915	±18	660	1.5%	2.0%	59 tps	1.2s	256K	$1.33	$5.33
155	113	GLM 4.5 AirX	913	±23	540	1.8%	3.3%	75 tps	1.2s	131K	$1.10	$4.50
156	186	Grok 3 Mini	908	±9	3.8K	2.3%	1.2%	43 tps	0.5s	131K	$0.30	$0.50
157	214	Qwen 2.5 7B	901	±19	490	4.9%	3.7%	40 tps	1.9s	131K	$0.08	$0.27
158	194	Llama 3.3 70B	900	±12	1.1K	3.0%	0.3%	500 tps	0.5s	8K	$0.48	$0.66
159	170	Devstral Medium	899	±10	995	1.5%	1.5%	77 tps	0.6s	131K	$0.40	$2.00
160	186	GLM 4.6V Flash	899	±15	1.3K	2.3%	3.7%	64 tps	2.1s	128K	$0.04	$0.40

4of5

View All (193 models)