Leaderboard | Text

Models

Choose model family

Claude by Anthropic

Mistral by Mistral AI

Topics

Choose topic

All topics Facts and Information Creative Writing and Ideation Logic and Problem-Solving Task Completion Coding

Choose language

All languages English Chinese Arabic Spanish Indonesian Japanese

More filters

Show inactive models

Hide models that are no longer actively available on Yupp.

Turns

Filter model performance by the number of turns in a conversation.

All Single turn Multiple turns

Open license models

Filter the leaderboard to only show models that have an open license.

All selected Open license Proprietary license

389

MiniMax M1 (Extended)

413

Mistral Nemo 12B Inferor v0.0

472

ArliAI: QwQ 32B RpR v1

612

QwQ 32B RpR v1

625

DeepSeek-R1 Distill Qwen 1.5B

629

Qwen 2.5 VL 3B Instruct

630

LFM2.5 1.2B Thinking

635

Phi 4 Mini Reasoning

639

OpenHands LM 32B V0.1

646

Phi 3.5 Mini 128k Instruct

667

UI-TARS 1.5 7B

678

DeepSeek-R1 Distill Llama 8B

688

MiniMax M1

697

Phi 4 Reasoning

721

DeepSeek-R1 Distill Qwen 7B

Last updated about 1 month ago

Rank	Overall	Name	VIBE Score	Confidence Interval	Votes	Downvote %	Abort %	Speed	Latency	Context	Cost (Input)	Cost (Output)
1	439	MiniMax M1 (Extended)	389	±23	495	1.0%	<0.1%	3 tps	N/A	128K	$0	$0
2	439	Mistral Nemo 12B Inferor v0.0	413	±9	2.5K	1.2%	<0.1%	83 tps	0.8s	16K	$0.80	$1.20
3	438	ArliAI: QwQ 32B RpR v1	472	±20	485	7.6%	<0.1%	20 tps	2.5s	33K	$0	$0
4	434	QwQ 32B RpR v1	612	±10	2.4K	7.0%	<0.1%	34 tps	3.3s	33K	$0.02	$0.07
5	430	DeepSeek-R1 Distill Qwen 1.5B	625	±11	1.5K	3.9%	<0.1%	20 tps	0.0s	131K	$0.18	$0.18
6	288	Qwen 2.5 VL 3B Instruct	629	±7	5.1K	6.8%	3.0%	44 tps	2.5s	128K	$0.21	$0.63
7	291	LFM2.5 1.2B Thinking	630	±22	705	4.7%	2.6%	258 tps	0.4s	33K	$0	$0
8	291	Phi 4 Mini Reasoning	635	±4	7.9K	7.9%	9.7%	30 tps	0.9s	128K	$0.07	$0.30
9	430	OpenHands LM 32B V0.1	639	±10	1.9K	1.0%	<0.1%	11 tps	N/A	16K	$2.60	$3.40
10	430	Phi 3.5 Mini 128k Instruct	646	±13	835	2.9%	<0.1%	14 tps	0.7s	128K	$0.10	$0.10
11	289	UI-TARS 1.5 7B	667	±18	1.4K	8.7%	4.0%	75 tps	0.9s	128K	$0.10	$0.20
12	428	DeepSeek-R1 Distill Llama 8B	678	±9	2.1K	3.4%	<0.1%	17 tps	N/A	32K	$0.04	$0.04
13	284	MiniMax M1	688	±4	7.8K	4.0%	<0.1%	31 tps	2.8s	1M	$0.55	$2.20
14	287	Phi 4 Reasoning	697	±8	4K	3.5%	21.0%	29 tps	1.0s	33K	$0.06	$0.25
15	424	DeepSeek-R1 Distill Qwen 7B	721	±9	1.1K	3.4%	<0.1%	0 tps	N/A	131K	$0.05	$0.10
16	419	Kimi Dev 72B	735	±10	1.1K	3.9%	<0.1%	17 tps	13.5s	131K	$0.12	$0.47
17	285	Hunyuan A13B Instruct	739	±5	4.6K	5.0%	2.3%	67 tps	2.0s	33K	$0.01	$0.01
18	424	ERNIE 4.5 0.3B	741	±13	1.5K	8.5%	<0.1%	85 tps	2.2s	120K	$0	$0
19	274	Pixtral 12B	755	±12	4.6K	5.7%	2.2%	101 tps	1.2s	131K	$0.08	$0.08
20	412	ArliAI QwQ 32B Arliai RpR V1	764	±11	1.1K	6.6%	<0.1%	34 tps	1.8s	33K	$0.02	$0.07
21	421	Llema 7B	766	±3	4.7K	1.4%	<0.1%	1 tps	15.0s	4K	$0.80	$1.20
22	285	Phi 4 Mini Instruct	778	±5	4.1K	3.2%	7.4%	40 tps	1.1s	128K	$0.07	$0.30
23	274	Moonshot V1 128k Vision	779	±12	955	5.0%	3.1%	44 tps	3.8s	131K	$2.00	$5.00
24	399	Magistral Medium (Thinking)	780	±6	3.7K	3.7%	<0.1%	67 tps	0.8s	41K	$2.00	$5.00
25	399	Gemini 1.5 Flash 8B	783	±7	1.4K	4.5%	<0.1%	11 tps	0.0s	1M	$0.02	$0.10
26	392	Phi 4 Reasoning Plus	784	±13	650	6.5%	<0.1%	32 tps	1.2s	33K	$0.04	$0.17
27	274	MiniMax M2-her	791	±11	1.1K	2.2%	<0.1%	108 tps	0.7s	205K	$0.30	$1.20
28	281	Goliath 120B	794	±5	3.1K	2.5%	2.7%	21 tps	2.2s	6K	$6.56	$9.38
29	274	C4AI Aya Expanse 8B	798	±12	1.2K	6.5%	0.9%	61 tps	0.4s	8K	$0.50	$1.50
30	412	Shisa V2 Llama 3.3 70B	798	±9	1.4K	6.5%	<0.1%	8 tps	2.0s	33K	$0.03	$0.09
31	406	DeepSeek-R1 Distill Qwen 14B	802	±5	3.6K	3.7%	<0.1%	44 tps	1.7s	64K	$0.63	$0.63
32	274	DeepSeek-R1 Distill Qwen 32B	807	±6	4K	3.3%	6.2%	22 tps	1.8s	131K	$0.37	$0.39
33	281	MythoMax L2 13B	814	±4	9.8K	2.5%	1.2%	22 tps	1.1s	4K	$0.18	$0.18
34	412	Dolphin 3.0 R1 Mistral 24B	819	±6	2.5K	4.5%	<0.1%	13 tps	0.1s	33K	$0.03	$0.09
35	412	Dolphin 2.9.2 Mixtral 8x22B	823	±3	5.8K	1.0%	<0.1%	20 tps	1.5s	16K	$0.90	$0.90
36	406	Command	823	±5	3.6K	2.0%	<0.1%	25 tps	N/A	4K	$0.83	$1.33
37	374	Cogito V2 671B	825	±10	2.3K	4.2%	<0.1%	41 tps	0.6s	164K	$1.25	$1.25
38	399	Phi 3 Medium 128k Instruct	827	±9	1.1K	3.1%	<0.1%	40 tps	1.3s	128K	$0.58	$0.84
39	274	LFM2 8B A1B	831	±7	2.3K	6.7%	<0.1%	142 tps	0.3s	33K	$0.01	$0.02
40	281	Gemma 2 9B	831	±9	1.6K	3.7%	<0.1%	100 tps	0.4s	8K	$0.09	$0.09

1of11

View All (432 models)