AI Compatibility Tier List

RX 580 8GB

380 AI models ranked by how well they run on your 8 GB VRAM hardware. Best match: Qwen 3.5 4B (score: 95).

380

Models tested

195

Can run

8 GB

VRAM

Best tok/s

Tier Distribution

S 3

A 29

B 21

C 142

F 185

S: 3A: 29B: 21C: 142F: 185

Post on X

S Tier -- Perfect Fit (3 models)

These models run flawlessly with headroom to spare.

Qwen 3.5 4B

S95

4B6.3 GB49 tok/s28K ctx

dense

Phi-4 Mini Reasoning 4B

S92

3.8B5.5 GB51 tok/s43K ctx

dense

Qwen 3 4B

S86

4B6.3 GB49 tok/s28K ctx

dense

A Tier -- Great Fit (29 models)

Excellent performance with comfortable memory margins.

Jina Embeddings v3

A84

0.57B4.8 GB8 tok/s8K ctx

dense

BGE M3

A81

0.57B4.0 GB8 tok/s8K ctx

dense

Qwen 2.5 Coder 3B

A80

3B5.7 GB42 tok/s33K ctx

dense

Qwen 2.5 VL 7B

A80

7B6.8 GB28 tok/s33K ctx

dense

SQLCoder 7B

A80

7B7.9 GB28 tok/s8K ctx

dense

Qwen 3.5 9B

A79

9B9.4 GB11 tok/s6K ctx

dense

Codestral Mamba 7B

A78

7B6.5 GB30 tok/s67K ctx

state-space

Qwen 3 8B

A78

8B8.8 GB14 tok/s10K ctx

dense

Magistral 7B

A78

7B7.9 GB28 tok/s8K ctx

dense

mxbai Embed Large

A77

0.34B3.9 GB5 tok/s1K ctx

dense

CodeGeeX 4 9B

A77

9B7.8 GB22 tok/s21K ctx

dense

Snowflake Arctic Embed L

A76

0.34B3.9 GB5 tok/s1K ctx

dense

LFM2.5 8B A1B

A76

8.5B7.1 GB52 tok/s97K ctx

moe

Gemma 4 E4B

A76

8B7.9 GB18 tok/s18K ctx

dense

Qwen 2.5 7B

A76

7B6.8 GB28 tok/s38K ctx

dense

Phi 4 Mini 4B

A75

4B5.6 GB49 tok/s42K ctx

dense

Gemma 4 E2B

A75

5.1B5.3 GB29 tok/s96K ctx

dense

DevStral 7B

A75

7B7.9 GB28 tok/s8K ctx

dense

Gemma 3 4B

A75

4B6.2 GB36 tok/s30K ctx

dense

BGE Large EN v1.5

A75

0.34B3.9 GB5 tok/s1K ctx

dense

Ministral 3 3B

A73

3B4.3 GB42 tok/s98K ctx

multimodal

Nemotron Nano 8B

A73

8B8.5 GB15 tok/s12K ctx

dense

Qwen 2.5 3B

A73

3B5.7 GB42 tok/s33K ctx

dense

Qwen 3.5 2B

A73

2B4.6 GB28 tok/s48K ctx

dense

GLM-4 9B

A71

9B7.8 GB22 tok/s21K ctx

dense

WizardMath 7B

A71

7B7.9 GB28 tok/s4K ctx

dense

OLMo 2 7B

A71

7B7.9 GB28 tok/s4K ctx

dense

InternVL2 8B

A70

8B8.5 GB15 tok/s8K ctx

dense

Granite Code 3B

A70

3B6.0 GB42 tok/s8K ctx

dense

B Tier -- Good Fit (21 models)

Solid performance, may need quantization or reduced context.

Qwen 2.5 Coder 7B

B70

7B6.8 GB28 tok/s38K ctx

dense

Nomic Embed Text v1.5

B70

0.14B2.5 GB2 tok/s8K ctx

dense

Granite 4.1 3B

B69

3B4.8 GB42 tok/s59K ctx

dense

Falcon 7B Instruct

B69

7B6.1 GB28 tok/s8K ctx

dense

Qwen 3 1.7B

B69

1.7B4.4 GB24 tok/s33K ctx

dense

MiniCPM-V 2.6 8B

B69

8B8.5 GB15 tok/s2K ctx

dense

Ministral 3 8B

B68

8B8.8 GB14 tok/s10K ctx

multimodal

DeepSeek R1 Distill 7B

B67

7B6.8 GB28 tok/s33K ctx

dense

Samantha 7B

B66

7B7.9 GB28 tok/s4K ctx

dense

Llama 3.2 3B

B66

3B5.2 GB42 tok/s42K ctx

dense

Qwen 2.5 Coder 1.5B

B64

1.5B3.0 GB21 tok/s33K ctx

dense

Granite Code 8B

B63

8B8.5 GB15 tok/s8K ctx

dense

All MiniLM L6 v2

B63

0.02B2.0 GB2 tok/s0K ctx

dense

Mistral 7B Instruct v0.3

B62

7B7.9 GB28 tok/s8K ctx

dense

Granite 4.1 8B

B62

8B9.0 GB14 tok/s9K ctx

dense

SmolLM3 3B

B62

3B5.5 GB42 tok/s37K ctx

dense

Llama 3.1 8B

B59

8B8.5 GB15 tok/s12K ctx

dense

Solar 7B

B59

7B8.9 GB16 tok/s8K ctx

dense

DeepSeek R1 1.5B

B56

1.5B3.0 GB21 tok/s33K ctx

dense

Nemotron Mini 4B

B56

4B6.1 GB49 tok/s4K ctx

dense

TinyLlama 1.1B

B55

1.1B2.7 GB15 tok/s4K ctx

dense

C Tier -- Tight Fit (142 models)

Runs with offloading or significant compromises.

Gemma 2 2B

C55

2B4.5 GB28 tok/s8K ctx

dense

DeepSeek R1 Distill 8B

C55

8B8.5 GB15 tok/s12K ctx

dense

Qwen 2.5 Math 7B

C54

7B6.8 GB28 tok/s4K ctx

dense

Yi 1.5 6B Chat

C53

6B6.1 GB30 tok/s60K ctx

dense

Yi 1.5 6B

C53

6B6.3 GB33 tok/s4K ctx

dense

Qwen 2.5 1.5B

C53

1.5B3.0 GB21 tok/s131K ctx

dense

stablelm 2 zephyr 1 6b

C53

6B6.1 GB30 tok/s60K ctx

dense

Yi 1.5 6B Chat

C53

6B6.1 GB30 tok/s60K ctx

dense

stablelm 2 1 6b chat imatrix

C53

6B6.1 GB30 tok/s60K ctx

dense

HelpingAI2 6B

C53

6B6.1 GB30 tok/s60K ctx

dense

HelpingAI2 6B i1

C53

6B6.1 GB30 tok/s60K ctx

dense

HelpingAI2.5 5B i1

C53

5B5.3 GB36 tok/s89K ctx

dense

StarCoder2 7B

C52

7B6.5 GB28 tok/s16K ctx

dense

Qwen3.5 4B

C52

4B4.6 GB45 tok/s132K ctx

dense

gemma 3 4b it

C52

4B4.6 GB45 tok/s132K ctx

dense

gemma 3 4b it

C52

4B4.6 GB45 tok/s132K ctx

dense

OpenChat 7B

C52

7B7.9 GB28 tok/s8K ctx

dense

Gemma 3 1B

C51

1B2.7 GB14 tok/s33K ctx

dense

Llama 3.2 3B Instruct

C51

3B4.2 GB42 tok/s188K ctx

dense

OpenHermes 2.5 7B

C51

7B7.9 GB28 tok/s8K ctx

dense

Zephyr 7B Beta

C51

7B7.9 GB28 tok/s17K ctx

dense

Starling LM 7B

C50

7B7.9 GB28 tok/s8K ctx

dense

Llama 2 7B Chat

C50

7B6.8 GB26 tok/s40K ctx

dense

Qwen2.5 3B Instruct

C50

3B3.9 GB42 tok/s203K ctx

dense

falcon mamba 7b instruct Q4 K M

C50

7B6.8 GB30 tok/s40K ctx

dense

Mistral 7B Instruct v0.2

C50

7B6.8 GB26 tok/s40K ctx

dense

LFM2.5 350M

C50

0.35B2.1 GB5 tok/s128K ctx

dense

Mistral 7B Instruct v0.3

C50

7B6.8 GB26 tok/s40K ctx

dense

Llama 3.2 3B Instruct

C50

3B3.9 GB42 tok/s203K ctx

dense

Yi Coder 9B

C50

9B8.7 GB13 tok/s9K ctx

dense

Ministral 3 3B Instruct 2512

C50

3B3.9 GB42 tok/s203K ctx

dense

Mamba Codestral 7B v0.1

C50

7B6.8 GB30 tok/s40K ctx

dense

Mistral 7B Instruct v0.3

C50

7B6.8 GB26 tok/s40K ctx

dense

Hermes 2 Pro Mistral 7B

C50

7B6.8 GB26 tok/s40K ctx

dense

zephyr 7B beta

C50

7B6.8 GB26 tok/s40K ctx

dense

Nous Hermes 2 Mistral 7B DPO

C50

7B6.8 GB26 tok/s40K ctx

dense

Meta Llama 3.1 8B Instruct

C50

8B7.5 GB23 tok/s24K ctx

dense

HELVETE 3B

C50

3B3.9 GB42 tok/s203K ctx

dense

Falcon H1R 7B

C50

7B6.8 GB26 tok/s40K ctx

dense

llava llama 3 8b v1 1

C50

8B7.5 GB23 tok/s24K ctx

dense

Hermes 3 Llama 3.2 3B

C50

3B3.9 GB42 tok/s203K ctx

dense

stablelm zephyr 3b

C50

3B3.9 GB42 tok/s203K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C50

8B7.5 GB23 tok/s24K ctx

dense

zephyr 7B alpha

C50

7B6.8 GB26 tok/s40K ctx

dense

speechless zephyr code functionary 7b

C50

7B6.8 GB26 tok/s40K ctx

dense

StarCoder2 3B

C50

3B3.9 GB42 tok/s203K ctx

dense

StarCoder2 7B

C50

7B6.8 GB26 tok/s40K ctx

dense

Meta Llama 3 8B Instruct

C50

8B7.5 GB23 tok/s24K ctx

dense

DeepSeek R1 Distill Llama 8B

C50

8B7.5 GB23 tok/s24K ctx

dense

japanese stablelm instruct gamma 7B

C50

7B6.8 GB26 tok/s40K ctx

dense

Dolphin3.0 Llama3.1 8B

C50

8B7.5 GB23 tok/s24K ctx

dense

Llama 3 8B Instruct 32k v0.1

C50

8B7.5 GB23 tok/s24K ctx

dense

Falcon H1 7B Instruct

C50

7B6.8 GB26 tok/s40K ctx

dense

Falcon H1R 7B

C50

7B6.8 GB26 tok/s40K ctx

dense

Meta Llama 3.1 8B Instruct

C50

8B7.5 GB23 tok/s24K ctx

dense

AI21 Jamba Reasoning 3B

C50

3B3.9 GB42 tok/s203K ctx

dense

vntl llama3 8b v2

C50

8B7.5 GB23 tok/s24K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C49

8B7.5 GB23 tok/s24K ctx

dense

stablelm 3b 4e1t

C49

3B3.9 GB42 tok/s203K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C49

8B7.5 GB23 tok/s24K ctx

dense

ai21labs AI21 Jamba Reasoning 3B

C49

3B3.9 GB42 tok/s203K ctx

dense

stabilityai japanese stablelm base gamma 7b

C49

7B6.8 GB26 tok/s40K ctx

dense

Qwen3 8B DeepSeek v3.2 Speciale Distill

C49

8B7.5 GB23 tok/s24K ctx

dense

baichuan2 7b chat

C49

7B6.8 GB26 tok/s40K ctx

dense

Hermes 3 Llama 3.1 8B

C49

8B7.5 GB23 tok/s24K ctx

dense

DiscoPOP zephyr 7b gemma

C49

7B6.8 GB26 tok/s40K ctx

dense

ai21labs AI21 Jamba2 3B

C49

3B3.9 GB42 tok/s203K ctx

dense

starcoder2 7b

C49

7B6.8 GB26 tok/s40K ctx

dense

zephyr 7b beta Mistral 7B Instruct v0.2

C49

7B6.8 GB26 tok/s40K ctx

dense

OpenChat 3.5 7B Qwen v2.0 i1

C49

7B6.8 GB26 tok/s40K ctx

dense

OpenChat 3.5 7B Starling v2.0 i1

C49

7B6.8 GB26 tok/s40K ctx

dense

internlm2 math plus 7b IMat

C49

7B6.8 GB26 tok/s40K ctx

dense

CodeNinja 1.0 OpenChat 7B i1

C49

7B6.8 GB26 tok/s40K ctx

dense

HelpingAI 3B hindi i1

C49

3B3.9 GB42 tok/s203K ctx

dense

Hermes 2 Pro Llama 3 8B

C49

8B7.5 GB23 tok/s24K ctx

dense

Dolphin3.0 Llama3.1 8B

C49

8B7.5 GB23 tok/s24K ctx

dense

AI21 Jamba2 3B

C49

3B3.9 GB42 tok/s203K ctx

dense

internlm2 5 7b chat i1

C49

7B6.8 GB26 tok/s40K ctx

dense

OpenSafetyLab MD Judge v0 2 internlm2 7b

C49

7B6.8 GB26 tok/s40K ctx

dense

HelpingAI 3B hindi

C49

3B3.9 GB42 tok/s203K ctx

dense

MD Judge v0 2 internlm2 7b i1

C49

7B6.8 GB26 tok/s40K ctx

dense

granite 8b code instruct 4k

C49

8B7.5 GB23 tok/s24K ctx

dense

Neural Chat 7B

C49

7B7.9 GB28 tok/s8K ctx

dense

zephyr 7b gemma sft african ultrachat 100k

C49

7B6.8 GB26 tok/s40K ctx

dense

dolphin 2.9.4 llama3.1 8b

C49

8B7.5 GB23 tok/s24K ctx

dense

jointpreferences mistral 7b sft helpful

C49

7B6.8 GB26 tok/s40K ctx

dense

AI21 Jamba2 3B i1

C49

3B3.9 GB42 tok/s203K ctx

dense

zephyr 7b dpo full i1

C49

7B6.8 GB26 tok/s40K ctx

dense

blossom v3 baichuan2 7b i1

C49

7B6.8 GB26 tok/s40K ctx

dense

EXAONE 3.5 7.8B Instruct

C49

7.8B7.4 GB23 tok/s27K ctx

dense

blossom v1 baichuan 7b i1

C49

7B6.8 GB26 tok/s40K ctx

dense

EXAONE 3.5 7.8B Instruct

C49

7.8B7.4 GB23 tok/s27K ctx

dense

openchat 3.6 8b 20240522 IMat

C49

8B7.5 GB23 tok/s24K ctx

dense

EXAONE 3.5 7.8B Instruct i1

C49

7.8B7.4 GB23 tok/s27K ctx

dense

aya expanse 8b

C49

8B7.5 GB23 tok/s24K ctx

dense

exaone 3.0 7.8b it

C49

7.8B7.4 GB23 tok/s27K ctx

dense

dolphin v2 8b abliterated i1

C49

8B7.5 GB23 tok/s24K ctx

dense

aya expanse 8b orthogonal heretic i1

C49

8B7.5 GB23 tok/s24K ctx

dense

aya expanse 8b orthogonal heretic

C49

8B7.5 GB23 tok/s24K ctx

dense

internlm2 5 1 8b chat i1

C49

8B7.5 GB23 tok/s24K ctx

dense

internlm3 8b instruct abliterated i1

C49

8B7.5 GB23 tok/s24K ctx

dense

StarCoder2 3B

C49

3B4.0 GB42 tok/s16K ctx

dense

Qwen 2.5 Coder 0.5B

C49

0.5B2.2 GB7 tok/s131K ctx

dense

Qwen 3 0.6B

C48

0.6B2.9 GB8 tok/s33K ctx

dense

Qwen3.5 9B

C48

9B8.2 GB14 tok/s12K ctx

dense

Qwen3.5 9B Uncensored HauhauCS Aggressive

C48

9B8.2 GB14 tok/s12K ctx

dense

gemma 2 2b it

C48

2B3.6 GB28 tok/s318K ctx

dense

Qwen3.5 9B

C48

9B8.2 GB14 tok/s12K ctx

dense

Llama 3.2 1B

C48

1B2.8 GB14 tok/s128K ctx

dense

Yi Coder 9B Chat

C48

9B8.2 GB14 tok/s12K ctx

dense

glm 4 9b chat 1m

C48

9B8.2 GB14 tok/s12K ctx

dense

Yi 1.5 9B Chat

C48

9B8.2 GB14 tok/s12K ctx

dense

EXAONE 3.5 2.4B Instruct

C48

2.4B3.4 GB34 tok/s275K ctx

dense

Yi 9B Coder i1

C47

9B8.2 GB14 tok/s12K ctx

dense

Ministral 8B

C47

8B8.8 GB14 tok/s10K ctx

dense

HelpingAI2 9B

C47

9B8.2 GB14 tok/s12K ctx

dense

HelpingAI2 9B i1

C47

9B8.2 GB14 tok/s12K ctx

dense

HelpingAI 9B 200k i1

C47

9B8.2 GB14 tok/s12K ctx

dense

HelpingAI 9B i1

C47

9B8.2 GB14 tok/s12K ctx

dense

gemma 2b

C47

2B3.2 GB28 tok/s347K ctx

dense

Gemmasutra Mini 2B v1

C47

2B3.2 GB28 tok/s347K ctx

dense

gemma 2 2b it

C47

2B3.2 GB28 tok/s347K ctx

dense

Qwen 3.5 0.6B

C46

0.6B2.9 GB8 tok/s111K ctx

dense

Qwen2.5 1.5B Instruct

C45

1.5B2.8 GB21 tok/s490K ctx

dense

DeepSeek R1 Distill Qwen 1.5B

C45

1.5B2.8 GB21 tok/s490K ctx

dense

Yi Coder 1.5B Chat

C45

1.5B2.8 GB21 tok/s490K ctx

dense

stablelm 2 zephyr 1.6b

C45

1.6B2.9 GB22 tok/s454K ctx

dense

logos16v2 stablelm2 1.6b i1

C45

1.6B2.9 GB22 tok/s454K ctx

dense

Yi Coder 1.5B

C44

1.5B2.8 GB21 tok/s490K ctx

dense

Falcon H1 1.5B Instruct

C44

1.5B2.8 GB21 tok/s490K ctx

dense

EXAONE 4.0 1.2B

C43

1.2B2.6 GB17 tok/s634K ctx

dense

Granite 3.1 8B

C43

8B8.5 GB18 tok/s12K ctx

state-space

Llama 3.2 1B Instruct Q8 0

C43

1B2.6 GB14 tok/s748K ctx

dense

TinyLlama 1.1B Chat v1.0

C43

1.1B2.5 GB15 tok/s699K ctx

dense

TinyLlama 1.1B Chat v0.3

C43

1.1B2.5 GB15 tok/s699K ctx

dense

TinyLlama 1.1B Chat v0.6

C43

1.1B2.5 GB15 tok/s699K ctx

dense

TinyLlama 1.1B Chat v1.0 imatrix

C42

1.1B2.5 GB15 tok/s699K ctx

dense

Llama 3.2 1B Instruct

C42

1B2.4 GB14 tok/s777K ctx

dense

gemma 3 1b it

C42

1B2.4 GB14 tok/s777K ctx

dense

Qwen 2.5 0.5B

C42

0.5B2.2 GB7 tok/s131K ctx

dense

Yi 1.5 9B

C42

9B8.7 GB13 tok/s4K ctx

dense

Falcon3 1B Instruct abliterated

C42

1B2.4 GB14 tok/s777K ctx

dense

F Tier -- Can't Run (185 models)

Too heavy for this hardware.

SmolVLM 500M Instruct

D40

0.5B2.2 GB7 tok/s942K ctx

dense

Aya Expanse 8B

D40

8B8.5 GB15 tok/s8K ctx

dense

Dolphin 2.9 8B

D39

8B8.5 GB15 tok/s12K ctx

dense

embeddinggemma 300M

D38

0.3B2.0 GB4 tok/s969K ctx

dense

HelpingAI2.5 10B i1

D36

10B9.0 GB10 tok/s4K ctx

dense

Helply 10.2b chat i1

D36

10.2B9.1 GB10 tok/s4K ctx

dense

granite embedding 107m multilingual

D35

0.11B1.9 GB2 tok/s998K ctx

dense

Falcon H1 Tiny 90M Instruct

D35

0.09B1.9 GB2 tok/s999K ctx

dense

SOLAR 10.7B Instruct v1.0 uncensored

D30

10.7B9.5 GB9 tok/s4K ctx

dense

Nous Hermes 2 SOLAR 10.7B

D30

10.7B9.5 GB9 tok/s4K ctx

dense

solar finalised finetuned Model 10.7B i1

D30

10.7B9.5 GB9 tok/s4K ctx

dense

SOLAR 10.7B v1.0

D30

10.7B9.5 GB9 tok/s4K ctx

dense

Llama 3.1 70B

70B49.3 GB2 tok/s4K ctx

dense

Llama 3.3 70B

70B49.3 GB2 tok/s4K ctx

dense

Llama 3.2 11B Vision

11B10.4 GB7 tok/s4K ctx

vision

Qwen 2.5 14B

14B13.2 GB3 tok/s4K ctx

dense

Qwen 2.5 32B

32B25.1 GB2 tok/s4K ctx

dense

Qwen 2.5 72B

72B50.5 GB2 tok/s4K ctx

dense

Qwen 2.5 Coder 14B

14B13.2 GB3 tok/s4K ctx

dense

Qwen 2.5 Coder 32B

32B25.1 GB2 tok/s4K ctx

dense

Qwen 3 14B

14B12.7 GB4 tok/s4K ctx

dense

Qwen 3 32B

32B25.1 GB2 tok/s4K ctx

dense

Qwen 3 235B A22B

235B147.9 GB2 tok/s4K ctx

moe

Qwen 3 30B A3B

30.5B21.8 GB3 tok/s4K ctx

moe

Qwen3-Coder 30B A3B Instruct

30.5B21.8 GB3 tok/s4K ctx

moe

Qwen3-Coder-Next

80B52.0 GB2 tok/s4K ctx

moe

Qwen3-Coder 480B A35B Instruct

480B297.4 GB2 tok/s4K ctx

moe

Qwen3-VL 30B A3B Instruct

30B21.5 GB3 tok/s4K ctx

moe

Qwen 3.5 27B

27B21.3 GB2 tok/s4K ctx

dense

Qwen 3.5 35B A3B

35B24.5 GB2 tok/s4K ctx

moe

Qwen 3.6 35B A3B

35B27.2 GB2 tok/s4K ctx

moe

Qwen 3.6 27B

27B19.1 GB2 tok/s4K ctx

dense

Qwen 3.5 122B A10B

122B78.6 GB2 tok/s4K ctx

moe

Qwen 3.5 397B A17B

397B246.7 GB2 tok/s4K ctx

moe

Gemma 2 9B

9B12.3 GB5 tok/s4K ctx

dense

Gemma 2 27B

27B29.4 GB2 tok/s4K ctx

dense

Gemma 3 12B

12B13.9 GB3 tok/s4K ctx

dense

Gemma 3 27B

27B29.4 GB2 tok/s4K ctx

dense

Ministral 3 14B

14B12.7 GB4 tok/s4K ctx

multimodal

Mistral Nemo 12B

12B11.5 GB5 tok/s4K ctx

dense

Mistral Small 24B

24B18.8 GB2 tok/s4K ctx

dense

Mistral Small 3.2 24B

24B18.8 GB2 tok/s4K ctx

vision

Mixtral 8x7B

47B32.3 GB2 tok/s4K ctx

moe

Mixtral 8x22B

141B91.1 GB2 tok/s4K ctx

moe

DeepSeek R1 Distill 14B

14B13.2 GB3 tok/s4K ctx

dense

DeepSeek R1 Distill 32B

32B25.1 GB2 tok/s4K ctx

dense

Phi 3.5 Mini 4B

4B10.0 GB20 tok/s11K ctx

dense

Phi-4 14B

14B13.3 GB3 tok/s4K ctx

dense

Phi-4-reasoning-plus 14B

14.7B13.7 GB3 tok/s4K ctx

dense

Granite 4.1 30B

30B23.9 GB2 tok/s4K ctx

dense

OLMo 2 13B

13B12.1 GB4 tok/s4K ctx

dense

Command R 35B

35B25.5 GB2 tok/s4K ctx

dense

Falcon 40B Instruct

40B32.3 GB2 tok/s4K ctx

dense

WizardLM 13B

13B21.8 GB2 tok/s4K ctx

dense

StarCoder 7B

7B13.3 GB6 tok/s4K ctx

dense

StarCoder 15B

15B27.1 GB2 tok/s4K ctx

dense

CodeLlama 7B Instruct

7B13.8 GB6 tok/s4K ctx

dense

CodeLlama 13B Instruct

13B21.8 GB2 tok/s4K ctx

dense

StarCoder2 15B

15B13.7 GB3 tok/s4K ctx

dense

MPT-7B-Instruct

7B13.8 GB6 tok/s4K ctx

dense

MPT-30B-Instruct

30B46.7 GB2 tok/s4K ctx

dense

InternLM 7B

7B13.8 GB6 tok/s4K ctx

dense

InternLM Chat 7B

7B13.8 GB6 tok/s4K ctx

dense

Devstral Small 1.1

24B18.8 GB2 tok/s4K ctx

dense

Devstral Small 2 24B Instruct

24B18.8 GB2 tok/s4K ctx

dense

Devstral 2 123B Instruct

123B82.1 GB2 tok/s4K ctx

dense

Mistral Small 4 119B

119B79.7 GB2 tok/s4K ctx

moe

Leanstral 119B A6B

119B83.1 GB2 tok/s4K ctx

moe

Mistral Large 3

675B418.8 GB2 tok/s4K ctx

moe

Magistral Small 2507

24B18.8 GB2 tok/s4K ctx

dense

Codestral 2 25.08

22B17.6 GB2 tok/s4K ctx

dense

GLM-5

744B474.6 GB2 tok/s4K ctx

moe

GLM-5.1

754B480.7 GB2 tok/s4K ctx

moe

Kimi K2.5

1000B619.1 GB2 tok/s4K ctx

moe

Kimi K2.6

1000B619.1 GB2 tok/s4K ctx

moe

Kimi Linear 48B A3B

48B31.9 GB2 tok/s4K ctx

linear

Nous Hermes 1.0

9B19.4 GB3 tok/s4K ctx

dense

Nous Dolphin 13B

13B23.3 GB2 tok/s4K ctx

dense

Baichuan 7B

7B13.8 GB6 tok/s4K ctx

dense

Baichuan 13B

13B23.3 GB2 tok/s4K ctx

dense

Cerebras-GPT 13B

13B20.8 GB2 tok/s4K ctx

dense

StableLM 2 12B

12B22.5 GB2 tok/s4K ctx

dense

InternLM 20B

20B34.4 GB2 tok/s4K ctx

dense

Yi 34B Chat

34B26.1 GB2 tok/s4K ctx

dense

DeepSeek V3 671B

671B470.6 GB2 tok/s4K ctx

moe

DeepSeek V3.1 671B

671B470.6 GB2 tok/s4K ctx

moe

DeepSeek V4 Pro

1600B865.6 GB2 tok/s4K ctx

moe

DeepSeek V4 Flash

284B161.0 GB2 tok/s4K ctx

moe

DeepSeek R1 671B

671B470.6 GB2 tok/s4K ctx

moe

DeepSeek Coder V2 16B

16B14.8 GB5 tok/s4K ctx

moe

DeepSeek Coder V2 236B

236B204.3 GB2 tok/s4K ctx

moe

DeepSeek V2.5 236B

236B204.3 GB2 tok/s4K ctx

moe

DeepSeek LLM 7B

7B13.3 GB6 tok/s4K ctx

dense

DeepSeek LLM 67B

67B48.4 GB2 tok/s4K ctx

dense

Llama 4 Scout 17B 16E

109B71.1 GB2 tok/s4K ctx

moe

Llama 4 Maverick 17B 128E

400B248.6 GB2 tok/s4K ctx

moe

Command R+ 104B

104B68.6 GB2 tok/s4K ctx

dense

Command A 111B

111B73.3 GB2 tok/s4K ctx

dense

Phi 3 Mini 3.8B

3.8B9.9 GB22 tok/s11K ctx

dense

Phi 3 Medium 14B

14B13.3 GB3 tok/s4K ctx

dense

Yi 1.5 34B

34B26.1 GB2 tok/s4K ctx

dense

Codestral 22B

22B17.6 GB2 tok/s4K ctx

dense

Pixtral 12B

12B11.5 GB5 tok/s4K ctx

dense

Pixtral Large 124B

124B82.7 GB2 tok/s4K ctx

dense

Qwen 2.5 VL 72B

72B50.5 GB2 tok/s4K ctx

dense

Qwen 2.5 Math 72B

72B50.5 GB2 tok/s4K ctx

dense

Nemotron 70B

70B49.3 GB2 tok/s4K ctx

dense

LLaVA 1.5 7B

7B13.8 GB6 tok/s4K ctx

dense

LLaVA 1.6 13B

13B21.8 GB2 tok/s4K ctx

dense

CogVLM2 19B

19B15.7 GB2 tok/s4K ctx

dense

Vicuna 7B

7B13.8 GB6 tok/s4K ctx

dense

Vicuna 13B

13B21.8 GB2 tok/s4K ctx

dense

Granite Code 20B

20B17.1 GB2 tok/s4K ctx

dense

GPT-OSS 20B

21B17.0 GB3 tok/s4K ctx

moe

OLMo 2 32B

32B25.1 GB2 tok/s4K ctx

dense

Nemotron Nano 9B v2

9B9.6 GB11 tok/s5K ctx

dense

Nemotron 3 Nano 30B

30B22.4 GB2 tok/s4K ctx

dense

EXAONE 4.0 32B

32B25.1 GB2 tok/s4K ctx

dense

LFM2 24B

24B18.8 GB2 tok/s4K ctx

dense

Llama 3.1 405B

405B256.4 GB2 tok/s4K ctx

dense

DeepSeek R1 Distill 70B

70B49.3 GB2 tok/s4K ctx

dense

Granite Code 34B

34B26.1 GB2 tok/s4K ctx

dense

GPT-OSS 120B

117B78.0 GB2 tok/s4K ctx

dense

Aya Expanse 32B

32B23.7 GB2 tok/s4K ctx

dense

Mistral Small 3.1 24B

24B18.8 GB2 tok/s4K ctx

dense

Gemma 4 26B A4B

25.2B20.7 GB3 tok/s4K ctx

moe

Gemma 4 31B

30.7B35.1 GB2 tok/s4K ctx

dense

DeepSeek V3.2

671B411.5 GB2 tok/s4K ctx

moe

Nemotron Cascade 2 30B A3B

30B22.9 GB3 tok/s4K ctx

moe

MiniMax M2.7

230B145.8 GB2 tok/s4K ctx

moe

GLM-5.2

753.3B480.3 GB2 tok/s4K ctx

moe

Gemma 4 12B

12B14.9 GB2 tok/s4K ctx

dense

DiffusionGemma 26B A4B

25.8B21.1 GB3 tok/s4K ctx

moe

Ornith 1.0 35B A3B

35.1B23.4 GB2 tok/s4K ctx

moe

Solar Open 100B

100B74.4 GB2 tok/s4K ctx

dense

Baichuan M2 32B Q4 K M

32B25.0 GB2 tok/s4K ctx

dense

baichuan inc Baichuan M2 32B

32B25.0 GB2 tok/s4K ctx

dense

Codestral 22B v0.1

22B17.7 GB2 tok/s4K ctx

dense

cognitivecomputations Dolphin Mistral 24B Venice Edition

24B19.2 GB2 tok/s4K ctx

dense

cognitivecomputations Dolphin3.0 R1 Mistral 24B

24B19.2 GB2 tok/s4K ctx

dense

internlm JanusCoder 14B

14B11.9 GB4 tok/s4K ctx

dense

internlm2 5 20b chat

20B16.2 GB2 tok/s4K ctx

dense

NousResearch Hermes 4 14B

14B11.9 GB4 tok/s4K ctx

dense

starcoder2 15b instruct v0.1

15B12.6 GB3 tok/s4K ctx

dense

Qwen3 48B A4B Savant Commander Distill 12X Closed Open Heretic Uncensored

48B36.6 GB2 tok/s4K ctx

dense

internlm2 limarp chat 20b

20B16.2 GB2 tok/s4K ctx

dense

Phi 4 reasoning vision 15B

15B12.6 GB3 tok/s4K ctx

dense

Codestral 22B v0.1 IMat

22B17.7 GB2 tok/s4K ctx

dense

EXAONE 4.0 32B

32B25.0 GB2 tok/s4K ctx

dense

K EXAONE 236B A23B

236B173.3 GB2 tok/s4K ctx

dense

Codestral 22B v0.1

22B17.7 GB2 tok/s4K ctx

dense

Qwen3.5 35B A3B

35B27.2 GB2 tok/s4K ctx

dense

starcoder2 15b instruct v0.1

15B12.6 GB3 tok/s4K ctx

dense

gemma 3 12b it

12B10.4 GB6 tok/s4K ctx

dense

gemma 3 27b it

27B21.3 GB2 tok/s4K ctx

dense

Llama 3.3 70B Instruct

70B52.6 GB2 tok/s4K ctx

dense

Mistral Small 24B Instruct 2501

24B19.2 GB2 tok/s4K ctx

dense

mistral small 3.1 24b instruct 2503 hf

24B19.2 GB2 tok/s4K ctx

dense

aya expanse 32b heretic MPOA i1

32B25.0 GB2 tok/s4K ctx

dense

Baichuan M3 235B

235B172.6 GB2 tok/s4K ctx

dense

Baichuan M3 235B i1

235B172.6 GB2 tok/s4K ctx

dense

BaichuanMed OCR 72B i1

72B54.1 GB2 tok/s4K ctx

dense

Codestral 21B Pruned i1

21B17.0 GB2 tok/s4K ctx

dense

Codestral 22B v0.1 i1

22B17.7 GB2 tok/s4K ctx

dense

Codestral RAG 19B Pruned i1

19B15.5 GB2 tok/s4K ctx

dense

Dolphin Mistral GLM 4.7 Flash 24B Venice Edition Thinking Uncensored i1

24B19.2 GB2 tok/s4K ctx

dense

HelpingAI 15B i1

15B12.6 GB3 tok/s4K ctx

dense

internlm2 math plus 20b i1

20B16.2 GB2 tok/s4K ctx

dense

Solar Open 100B i1

100B74.4 GB2 tok/s4K ctx

dense

Solar Open 69B REAP i1

69B51.9 GB2 tok/s4K ctx

dense

starcoder2 15b i1

15B12.6 GB3 tok/s4K ctx

dense

Hermes 4.3 36B

36B27.9 GB2 tok/s4K ctx

dense

stabilityai japanese stablelm instruct beta 70b

70B52.6 GB2 tok/s4K ctx

dense

Codestral 22B v0.1

22B17.7 GB2 tok/s4K ctx

dense

StarCoder2 15B

15B12.6 GB3 tok/s4K ctx

dense

GGUF SOLARized GraniStral 14B 1902 YeAM HCT

14B11.9 GB4 tok/s4K ctx

dense

GGUF SOLARized GraniStral 14B 2102 YeAM HCT 32QKV

14B11.9 GB4 tok/s4K ctx

dense

DeepSeek R1 Distill Qwen 14B

14B11.9 GB4 tok/s4K ctx

dense

gemma 3 27b it

27B21.3 GB2 tok/s4K ctx

dense

Mistral Small 3.2 24B Instruct 2506

24B19.2 GB2 tok/s4K ctx

dense

Qwen3.5 122B A10B

122B75.8 GB2 tok/s4K ctx

dense

Qwen3.5 27B

27B21.3 GB2 tok/s4K ctx

dense

Qwen3.5 35B A3B

35B27.2 GB2 tok/s4K ctx

dense

Qwen3.5 397B A17B

397B290.4 GB2 tok/s4K ctx

dense

cognitivecomputations Dolphin Mistral 24B Venice Edition

24B19.2 GB2 tok/s4K ctx

dense

Compare with...

See How Other Hardware Stacks Up

Check tier lists for similar GPUs and Apple Silicon configs

RTX 3050 8GB

8 GB VRAM

View tier list

RTX 3060 Ti 8GB

8 GB VRAM

View tier list

RTX 3070 8GB

8 GB VRAM

View tier list

RTX 4060 8GB

8 GB VRAM

View tier list

Full RX 580 8GB page Compare this hardware