AI Compatibility Tier List

Mac Studio M3 Ultra 256GB

380 AI models ranked by how well they run on your 256 GB unified memory hardware. Best match: Qwen 3.5 122B A10B (score: 93).

380

Models tested

345

Can run

256 GB

unified memory

Best tok/s

Tier Distribution

S 28

A 60

B 60

C 197

F 35

S: 28A: 60B: 60C: 197F: 35

Post on X

S Tier -- Perfect Fit (28 models)

These models run flawlessly with headroom to spare.

Qwen 3.5 122B A10B

S93

122B105.4 GB35 tok/s131K ctx

moe

Mistral Small 4 119B

S92

119B106.5 GB38 tok/s248K ctx

moe

DeepSeek V4 Flash

S91

284B187.9 GB18 tok/s4K ctx

moe

Qwen3-Coder 30B A3B Instruct

S90

30.5B48.6 GB84 tok/s256K ctx

moe

Devstral 2 123B Instruct

S90

123B108.9 GB8 tok/s241K ctx

dense

Qwen3-VL 30B A3B Instruct

S90

30B48.3 GB87 tok/s256K ctx

moe

Qwen 3.6 35B A3B

S90

35B54.0 GB71 tok/s262K ctx

moe

Qwen 3.5 35B A3B

S89

35B51.4 GB77 tok/s131K ctx

moe

Qwen3-Coder-Next

S88

80B78.8 GB38 tok/s256K ctx

moe

Qwen 3 30B A3B

S88

30.5B48.6 GB84 tok/s131K ctx

moe

Qwen 3.5 9B

S88

9B36.2 GB109 tok/s131K ctx

dense

Leanstral 119B A6B

S87

119B109.9 GB35 tok/s151K ctx

moe

Qwen 3.5 27B

S87

27B48.2 GB37 tok/s131K ctx

dense

GPT-OSS 120B

S87

117B104.8 GB9 tok/s131K ctx

dense

Command A 111B

S87

111B100.2 GB9 tok/s262K ctx

dense

Pixtral Large 124B

S86

124B109.6 GB8 tok/s131K ctx

dense

Qwen 3 14B

S86

14B39.5 GB70 tok/s131K ctx

dense

Magistral Small 2507

S86

24B45.6 GB41 tok/s131K ctx

dense

Qwen 3 8B

S86

8B35.6 GB112 tok/s131K ctx

dense

Devstral Small 2 24B Instruct

S86

24B45.6 GB41 tok/s256K ctx

dense

Qwen 3.6 27B

S86

27B46.0 GB28 tok/s262K ctx

dense

Qwen 3 235B A22B

S86

235B174.8 GB11 tok/s69K ctx

moe

GPT-OSS 20B

S86

21B43.8 GB107 tok/s128K ctx

moe

Qwen 3 32B

S85

32B52.0 GB31 tok/s131K ctx

dense

MiniMax M2.7

S85

230B172.6 GB20 tok/s65K ctx

moe

Phi-4-reasoning-plus 14B

S85

14.7B40.6 GB67 tok/s33K ctx

dense

Qwen 2.5 VL 72B

S85

72B77.4 GB14 tok/s33K ctx

dense

Nemotron Cascade 2 30B A3B

S85

30B49.8 GB86 tok/s262K ctx

moe

A Tier -- Great Fit (60 models)

Excellent performance with comfortable memory margins.

Nemotron 3 Nano 30B

A84

30B49.3 GB33 tok/s131K ctx

dense

Qwen 3.5 4B

A84

4B33.2 GB56 tok/s131K ctx

dense

Devstral Small 1.1

A84

24B45.6 GB41 tok/s131K ctx

dense

Gemma 4 26B A4B

A82

25.2B47.6 GB90 tok/s256K ctx

moe

Gemma 4 31B

A82

30.7B61.9 GB24 tok/s150K ctx

dense

Nemotron Nano 8B

A81

8B35.4 GB112 tok/s131K ctx

dense

Phi-4 Mini Reasoning 4B

A81

3.8B32.3 GB53 tok/s131K ctx

dense

Ministral 3 14B

A81

14B39.5 GB70 tok/s262K ctx

multimodal

EXAONE 4.0 32B

A79

32B52.0 GB31 tok/s131K ctx

dense

Llama 3.3 70B

A79

70B76.1 GB14 tok/s128K ctx

dense

Codestral 2 25.08

A79

22B44.4 GB42 tok/s256K ctx

dense

Mistral Small 3.2 24B

A79

24B45.6 GB41 tok/s131K ctx

vision

InternVL2 8B

A78

8B35.4 GB112 tok/s8K ctx

dense

CogVLM2 19B

A78

19B42.6 GB52 tok/s8K ctx

dense

Qwen 2.5 32B

A78

32B52.0 GB31 tok/s131K ctx

dense

LFM2 24B

A78

24B45.6 GB41 tok/s131K ctx

dense

Ornith 1.0 35B A3B

A78

35.1B50.3 GB77 tok/s262K ctx

moe

Phi-4 14B

A77

14B40.1 GB70 tok/s16K ctx

dense

Gemma 3 27B

A77

27B56.2 GB27 tok/s131K ctx

dense

Gemma 4 12B

A77

12B41.7 GB61 tok/s262K ctx

dense

Granite 4.1 30B

A77

30B50.8 GB33 tok/s131K ctx

dense

OLMo 2 32B

A77

32B52.0 GB31 tok/s4K ctx

dense

Ministral 3 8B

A77

8B35.6 GB112 tok/s262K ctx

multimodal

Mistral Small 24B

A77

24B45.6 GB41 tok/s33K ctx

dense

MiniCPM-V 2.6 8B

A77

8B35.4 GB112 tok/s2K ctx

dense

Qwen 2.5 14B

A76

14B40.0 GB70 tok/s131K ctx

dense

Llama 4 Scout 17B 16E

A76

109B98.0 GB21 tok/s488K ctx

moe

DiffusionGemma 26B A4B

A76

25.8B47.9 GB88 tok/s262K ctx

moe

Kimi Linear 48B A3B

A76

48B58.8 GB19 tok/s1049K ctx

linear

Llama 3.1 70B

A76

70B76.1 GB14 tok/s128K ctx

dense

Qwen 2.5 72B

A76

72B77.4 GB14 tok/s131K ctx

dense

Mistral Small 3.1 24B

A76

24B45.6 GB41 tok/s131K ctx

dense

Qwen 3 4B

A76

4B33.2 GB56 tok/s33K ctx

dense

Nemotron Nano 9B v2

A76

9B36.5 GB109 tok/s131K ctx

dense

SQLCoder 7B

A76

7B34.8 GB98 tok/s8K ctx

dense

Qwen 2.5 VL 7B

A75

7B33.7 GB98 tok/s33K ctx

dense

DeepSeek Coder V2 16B

A75

16B41.6 GB136 tok/s131K ctx

moe

Gemma 3 12B

A75

12B40.8 GB61 tok/s131K ctx

dense

Jina Embeddings v3

A75

0.57B31.7 GB8 tok/s8K ctx

dense

Granite Code 20B

A75

20B43.9 GB49 tok/s8K ctx

dense

Magistral 7B

A74

7B34.8 GB98 tok/s8K ctx

dense

CodeGeeX 4 9B

A74

9B34.6 GB111 tok/s131K ctx

dense

BGE M3

A74

0.57B30.8 GB8 tok/s8K ctx

dense

Gemma 4 E4B

A73

8B34.7 GB93 tok/s128K ctx

dense

OLMo 2 13B

A73

13B38.9 GB76 tok/s33K ctx

dense

Qwen 2.5 Coder 32B

A72

32B52.0 GB31 tok/s131K ctx

dense

CodeLlama 13B Instruct

A72

13B48.7 GB70 tok/s16K ctx

dense

Qwen 2.5 7B

A72

7B33.7 GB98 tok/s131K ctx

dense

StarCoder 15B

A71

15B54.0 GB53 tok/s8K ctx

dense

Granite Code 34B

A71

34B53.0 GB29 tok/s8K ctx

dense

Granite Code 8B

A71

8B35.4 GB112 tok/s8K ctx

dense

DeepSeek R1 Distill 70B

A71

70B76.1 GB14 tok/s131K ctx

dense

DevStral 7B

A71

7B34.8 GB98 tok/s8K ctx

dense

Codestral Mamba 7B

A71

7B33.3 GB98 tok/s262K ctx

state-space

Command R 35B

A70

35B52.3 GB28 tok/s131K ctx

dense

mxbai Embed Large

A70

0.34B30.7 GB5 tok/s1K ctx

dense

Granite 4.1 8B

A70

8B35.9 GB112 tok/s131K ctx

dense

DeepSeek R1 Distill 14B

A70

14B40.0 GB70 tok/s33K ctx

dense

LFM2.5 8B A1B

A70

8.5B33.9 GB262 tok/s128K ctx

moe

LLaVA 1.6 13B

A70

13B48.7 GB70 tok/s4K ctx

dense

B Tier -- Good Fit (60 models)

Solid performance, may need quantization or reduced context.

CodeLlama 7B Instruct

B70

7B40.6 GB98 tok/s16K ctx

dense

StarCoder 7B

B70

7B40.1 GB98 tok/s8K ctx

dense

DeepSeek R1 Distill 32B

B70

32B52.0 GB31 tok/s33K ctx

dense

Pixtral 12B

B70

12B38.3 GB82 tok/s131K ctx

dense

Snowflake Arctic Embed L

B69

0.34B30.7 GB5 tok/s1K ctx

dense

Qwen 2.5 Coder 3B

B69

3B32.6 GB42 tok/s131K ctx

dense

Nous Hermes 1.0

B68

9B46.2 GB101 tok/s16K ctx

dense

Gemma 4 E2B

B68

5.1B32.2 GB71 tok/s128K ctx

dense

BGE Large EN v1.5

B68

0.34B30.7 GB5 tok/s1K ctx

dense

WizardLM 13B

B67

13B48.7 GB70 tok/s8K ctx

dense

Vicuna 13B

B67

13B48.7 GB70 tok/s4K ctx

dense

GLM-4 9B

B67

9B34.6 GB111 tok/s128K ctx

dense

InternLM 7B

B67

7B40.6 GB98 tok/s8K ctx

dense

InternLM Chat 7B

B67

7B40.6 GB98 tok/s8K ctx

dense

MPT-30B-Instruct

B67

30B73.6 GB26 tok/s8K ctx

dense

Llama 3.1 8B

B67

8B35.4 GB112 tok/s128K ctx

dense

Nous Dolphin 13B

B67

13B50.1 GB61 tok/s16K ctx

dense

Solar 7B

B67

7B35.7 GB98 tok/s8K ctx

dense

WizardMath 7B

B67

7B34.8 GB98 tok/s4K ctx

dense

OLMo 2 7B

B67

7B34.8 GB98 tok/s4K ctx

dense

Nemotron 70B

B66

70B76.1 GB14 tok/s131K ctx

dense

Nomic Embed Text v1.5

B66

0.14B29.4 GB2 tok/s8K ctx

dense

Qwen 2.5 Coder 7B

B66

7B33.7 GB98 tok/s131K ctx

dense

Ministral 3 3B

B65

3B31.1 GB42 tok/s262K ctx

multimodal

Gemma 3 4B

B65

4B33.1 GB56 tok/s128K ctx

dense

Falcon 40B Instruct

B65

40B59.2 GB22 tok/s8K ctx

dense

Phi 4 Mini 4B

B65

4B32.5 GB56 tok/s128K ctx

dense

LLaVA 1.5 7B

B65

7B40.6 GB98 tok/s4K ctx

dense

Gemma 2 27B

B64

27B56.2 GB27 tok/s8K ctx

dense

Qwen 3.5 2B

B64

2B31.5 GB28 tok/s131K ctx

dense

Command R+ 104B

B63

104B95.4 GB10 tok/s131K ctx

dense

Mixtral 8x22B

B63

141B118.0 GB14 tok/s66K ctx

moe

DeepSeek R1 Distill 7B

B63

7B33.7 GB98 tok/s33K ctx

dense

MPT-7B-Instruct

B63

7B40.6 GB98 tok/s8K ctx

dense

Baichuan 7B

B63

7B40.6 GB98 tok/s8K ctx

dense

DeepSeek R1 Distill 8B

B63

8B35.4 GB112 tok/s33K ctx

dense

Baichuan 13B

B63

13B50.1 GB61 tok/s8K ctx

dense

Cerebras-GPT 13B

B62

13B47.7 GB61 tok/s131K ctx

dense

Samantha 7B

B62

7B34.8 GB98 tok/s4K ctx

dense

Qwen 2.5 3B

B62

3B32.6 GB42 tok/s131K ctx

dense

Falcon 7B Instruct

B62

7B32.9 GB98 tok/s8K ctx

dense

Mixtral 8x7B

B61

47B59.2 GB40 tok/s33K ctx

moe

Phi 3 Mini 3.8B

B61

3.8B36.7 GB53 tok/s128K ctx

dense

Qwen 3 1.7B

B61

1.7B31.3 GB24 tok/s33K ctx

dense

All MiniLM L6 v2

B61

0.02B28.9 GB2 tok/s0K ctx

dense

Llama 3.2 11B Vision

B61

11B37.2 GB89 tok/s16K ctx

vision

Gemma 2 9B

B61

9B39.2 GB81 tok/s8K ctx

dense

Phi 3.5 Mini 4B

B60

4B36.8 GB56 tok/s128K ctx

dense

Granite 4.1 3B

B60

3B31.6 GB42 tok/s131K ctx

dense

Qwen 2.5 Coder 14B

B60

14B40.0 GB70 tok/s131K ctx

dense

Qwen 2.5 Coder 1.5B

B59

1.5B29.9 GB21 tok/s33K ctx

dense

Granite Code 3B

B59

3B32.8 GB42 tok/s8K ctx

dense

Mistral Nemo 12B

B58

12B38.3 GB82 tok/s128K ctx

dense

Yi Coder 9B

B58

9B35.5 GB110 tok/s131K ctx

dense

Qwen 2.5 Math 72B

B58

72B77.4 GB14 tok/s4K ctx

dense

Mistral 7B Instruct v0.3

B58

7B34.8 GB98 tok/s8K ctx

dense

Yi 1.5 34B

B57

34B53.0 GB29 tok/s4K ctx

dense

Phi 3 Medium 14B

B57

14B40.1 GB70 tok/s128K ctx

dense

Llama 3.2 3B

B56

3B32.1 GB42 tok/s128K ctx

dense

Ministral 8B

B55

8B35.6 GB112 tok/s131K ctx

dense

C Tier -- Tight Fit (197 models)

Runs with offloading or significant compromises.

Codestral 22B

C55

22B44.4 GB45 tok/s33K ctx

dense

DeepSeek LLM 67B

C55

67B75.2 GB15 tok/s4K ctx

dense

InternLM 20B

C54

20B61.3 GB39 tok/s8K ctx

dense

DeepSeek R1 1.5B

C51

1.5B29.9 GB21 tok/s33K ctx

dense

TinyLlama 1.1B

C51

1.1B29.6 GB15 tok/s4K ctx

dense

SmolLM3 3B

C51

3B32.3 GB42 tok/s128K ctx

dense

Granite 3.1 8B

C51

8B35.4 GB112 tok/s128K ctx

state-space

Yi 1.5 9B

C50

9B35.5 GB110 tok/s4K ctx

dense

Qwen 2.5 Math 7B

C50

7B33.7 GB98 tok/s4K ctx

dense

Aya Expanse 32B

C50

32B50.5 GB31 tok/s8K ctx

dense

Qwen 2.5 1.5B

C49

1.5B29.9 GB21 tok/s131K ctx

dense

OpenChat 7B

C48

7B34.8 GB98 tok/s8K ctx

dense

LFM2.5 350M

C48

0.35B28.9 GB5 tok/s128K ctx

dense

Aya Expanse 8B

C48

8B35.4 GB112 tok/s8K ctx

dense

Gemma 3 1B

C47

1B29.6 GB14 tok/s33K ctx

dense

Vicuna 7B

C47

7B40.6 GB98 tok/s4K ctx

dense

OpenHermes 2.5 7B

C47

7B34.8 GB98 tok/s8K ctx

dense

Qwen3.5 122B A10B

C47

122B102.6 GB9 tok/s107K ctx

dense

Dolphin 2.9 8B

C47

8B35.4 GB112 tok/s33K ctx

dense

Zephyr 7B Beta

C46

7B34.8 GB98 tok/s33K ctx

dense

StarCoder2 15B

C46

15B40.6 GB57 tok/s16K ctx

dense

Gemma 2 2B

C46

2B31.4 GB28 tok/s8K ctx

dense

Qwen3.5 9B

C46

9B35.1 GB101 tok/s2280K ctx

dense

Qwen3.5 9B Uncensored HauhauCS Aggressive

C46

9B35.1 GB101 tok/s2280K ctx

dense

Starling LM 7B

C46

7B34.8 GB98 tok/s8K ctx

dense

Meta Llama 3.1 8B Instruct

C46

8B34.4 GB112 tok/s2575K ctx

dense

Qwen3.5 9B

C46

9B35.1 GB101 tok/s2280K ctx

dense

llava llama 3 8b v1 1

C46

8B34.4 GB112 tok/s2575K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Solar Open 100B

C46

100B101.3 GB9 tok/s129K ctx

dense

Solar Open 100B i1

C46

100B101.3 GB9 tok/s129K ctx

dense

Llama 2 7B Chat

C46

7B33.6 GB98 tok/s2955K ctx

dense

Meta Llama 3 8B Instruct

C46

8B34.4 GB112 tok/s2575K ctx

dense

Qwen 2.5 Coder 0.5B

C46

0.5B29.0 GB7 tok/s131K ctx

dense

DeepSeek R1 Distill Llama 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Dolphin3.0 Llama3.1 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Llama 3 8B Instruct 32k v0.1

C46

8B34.4 GB112 tok/s2575K ctx

dense

Mistral 7B Instruct v0.2

C46

7B33.6 GB98 tok/s2955K ctx

dense

Meta Llama 3.1 8B Instruct

C46

8B34.4 GB112 tok/s2575K ctx

dense

vntl llama3 8b v2

C46

8B34.4 GB112 tok/s2575K ctx

dense

StableLM 2 12B

C46

12B49.4 GB60 tok/s4K ctx

dense

Yi Coder 9B Chat

C46

9B35.1 GB101 tok/s2280K ctx

dense

Mistral 7B Instruct v0.3

C46

7B33.6 GB98 tok/s2955K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

glm 4 9b chat 1m

C46

9B35.1 GB101 tok/s2280K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Qwen3 8B DeepSeek v3.2 Speciale Distill

C46

8B34.4 GB112 tok/s2575K ctx

dense

Hermes 3 Llama 3.1 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Yi 34B Chat

C46

34B53.0 GB29 tok/s200K ctx

dense

Yi 1.5 9B Chat

C46

9B35.1 GB101 tok/s2280K ctx

dense

SOLAR 10.7B Instruct v1.0 uncensored

C46

10.7B36.3 GB85 tok/s1904K ctx

dense

Hermes 2 Pro Llama 3 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Dolphin3.0 Llama3.1 8B

C46

8B34.4 GB112 tok/s2575K ctx

dense

Nous Hermes 2 SOLAR 10.7B

C46

10.7B36.3 GB85 tok/s1904K ctx

dense

granite 8b code instruct 4k

C46

8B34.4 GB112 tok/s2575K ctx

dense

Mistral 7B Instruct v0.3

C46

7B33.6 GB98 tok/s2955K ctx

dense

Hermes 2 Pro Mistral 7B

C46

7B33.6 GB98 tok/s2955K ctx

dense

dolphin 2.9.4 llama3.1 8b

C46

8B34.4 GB112 tok/s2575K ctx

dense

gemma 3 12b it

C46

12B37.3 GB76 tok/s1689K ctx

dense

zephyr 7B beta

C46

7B33.6 GB98 tok/s2955K ctx

dense

Nous Hermes 2 Mistral 7B DPO

C46

7B33.6 GB98 tok/s2955K ctx

dense

openchat 3.6 8b 20240522 IMat

C46

8B34.4 GB112 tok/s2575K ctx

dense

Falcon H1R 7B

C46

7B33.6 GB98 tok/s2955K ctx

dense

aya expanse 8b

C46

8B34.4 GB112 tok/s2575K ctx

dense

EXAONE 3.5 7.8B Instruct

C46

7.8B34.2 GB109 tok/s2643K ctx

dense

falcon mamba 7b instruct Q4 K M

C46

7B33.6 GB98 tok/s2955K ctx

dense

dolphin v2 8b abliterated i1

C46

8B34.4 GB112 tok/s2575K ctx

dense

zephyr 7B alpha

C46

7B33.6 GB98 tok/s2955K ctx

dense

EXAONE 3.5 7.8B Instruct

C46

7.8B34.2 GB109 tok/s2643K ctx

dense

speechless zephyr code functionary 7b

C46

7B33.6 GB98 tok/s2955K ctx

dense

Yi 9B Coder i1

C46

9B35.1 GB101 tok/s2280K ctx

dense

EXAONE 3.5 7.8B Instruct i1

C46

7.8B34.2 GB109 tok/s2643K ctx

dense

StarCoder2 7B

C46

7B33.6 GB98 tok/s2955K ctx

dense

aya expanse 8b orthogonal heretic i1

C46

8B34.4 GB112 tok/s2575K ctx

dense

exaone 3.0 7.8b it

C46

7.8B34.2 GB109 tok/s2643K ctx

dense

japanese stablelm instruct gamma 7B

C46

7B33.6 GB98 tok/s2955K ctx

dense

solar finalised finetuned Model 10.7B i1

C46

10.7B36.3 GB85 tok/s1904K ctx

dense

HelpingAI2 9B

C46

9B35.1 GB101 tok/s2280K ctx

dense

Falcon H1 7B Instruct

C46

7B33.6 GB98 tok/s2955K ctx

dense

HelpingAI2.5 10B i1

C46

10B35.8 GB91 tok/s2044K ctx

dense

Falcon H1R 7B

C46

7B33.6 GB98 tok/s2955K ctx

dense

Yi 1.5 6B Chat

C46

6B32.9 GB84 tok/s3461K ctx

dense

SOLAR 10.7B v1.0

C45

10.7B36.3 GB85 tok/s1904K ctx

dense

aya expanse 8b orthogonal heretic

C45

8B34.4 GB112 tok/s2575K ctx

dense

HelpingAI2 9B i1

C45

9B35.1 GB101 tok/s2280K ctx

dense

Helply 10.2b chat i1

C45

10.2B36.0 GB90 tok/s2002K ctx

dense

HelpingAI 9B 200k i1

C45

9B35.1 GB101 tok/s2280K ctx

dense

stablelm 2 zephyr 1 6b

C45

6B32.9 GB84 tok/s3461K ctx

dense

HelpingAI 9B i1

C45

9B35.1 GB101 tok/s2280K ctx

dense

Mamba Codestral 7B v0.1

C45

7B33.6 GB98 tok/s2955K ctx

dense

DeepSeek R1 Distill Qwen 14B

C45

14B38.7 GB65 tok/s1436K ctx

dense

stabilityai japanese stablelm base gamma 7b

C45

7B33.6 GB98 tok/s2955K ctx

dense

baichuan2 7b chat

C45

7B33.6 GB98 tok/s2955K ctx

dense

internlm2 5 1 8b chat i1

C45

8B34.4 GB112 tok/s2575K ctx

dense

internlm3 8b instruct abliterated i1

C45

8B34.4 GB112 tok/s2575K ctx

dense

DiscoPOP zephyr 7b gemma

C45

7B33.6 GB98 tok/s2955K ctx

dense

starcoder2 7b

C45

7B33.6 GB98 tok/s2955K ctx

dense

zephyr 7b beta Mistral 7B Instruct v0.2

C45

7B33.6 GB98 tok/s2955K ctx

dense

OpenChat 3.5 7B Qwen v2.0 i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

OpenChat 3.5 7B Starling v2.0 i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

internlm2 math plus 7b IMat

C45

7B33.6 GB98 tok/s2955K ctx

dense

CodeNinja 1.0 OpenChat 7B i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

internlm2 5 7b chat i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

OpenSafetyLab MD Judge v0 2 internlm2 7b

C45

7B33.6 GB98 tok/s2955K ctx

dense

Yi 1.5 6B

C45

6B33.2 GB84 tok/s4K ctx

dense

MD Judge v0 2 internlm2 7b i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

Yi 1.5 6B Chat

C45

6B32.9 GB84 tok/s3461K ctx

dense

stablelm 2 1 6b chat imatrix

C45

6B32.9 GB84 tok/s3461K ctx

dense

zephyr 7b gemma sft african ultrachat 100k

C45

7B33.6 GB98 tok/s2955K ctx

dense

jointpreferences mistral 7b sft helpful

C45

7B33.6 GB98 tok/s2955K ctx

dense

zephyr 7b dpo full i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

blossom v3 baichuan2 7b i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

blossom v1 baichuan 7b i1

C45

7B33.6 GB98 tok/s2955K ctx

dense

Neural Chat 7B

C45

7B34.8 GB98 tok/s8K ctx

dense

NousResearch Hermes 4 14B

C45

14B38.7 GB65 tok/s1436K ctx

dense

Phi 4 reasoning vision 15B

C45

15B39.5 GB61 tok/s1335K ctx

dense

StarCoder2 15B

C45

15B39.5 GB61 tok/s1335K ctx

dense

Llama 3.3 70B Instruct

C45

70B79.5 GB13 tok/s221K ctx

dense

HelpingAI2 6B

C45

6B32.9 GB84 tok/s3461K ctx

dense

StarCoder2 7B

C45

7B33.3 GB98 tok/s16K ctx

dense

GGUF SOLARized GraniStral 14B 2102 YeAM HCT 32QKV

C45

14B38.7 GB65 tok/s1436K ctx

dense

HelpingAI2 6B i1

C45

6B32.9 GB84 tok/s3461K ctx

dense

Nemotron Mini 4B

C45

4B32.9 GB56 tok/s4K ctx

dense

internlm JanusCoder 14B

C45

14B38.7 GB65 tok/s1436K ctx

dense

DeepSeek LLM 7B

C45

7B40.1 GB98 tok/s4K ctx

dense

GGUF SOLARized GraniStral 14B 1902 YeAM HCT

C45

14B38.7 GB65 tok/s1436K ctx

dense

starcoder2 15b instruct v0.1

C45

15B39.5 GB61 tok/s1335K ctx

dense

starcoder2 15b i1

C45

15B39.5 GB61 tok/s1335K ctx

dense

starcoder2 15b instruct v0.1

C45

15B39.5 GB61 tok/s1335K ctx

dense

HelpingAI 15B i1

C45

15B39.5 GB61 tok/s1335K ctx

dense

Qwen3.5 27B

C45

27B48.2 GB34 tok/s704K ctx

dense

Solar Open 69B REAP i1

C45

69B78.7 GB13 tok/s225K ctx

dense

Mistral Small 3.2 24B Instruct 2506

C45

24B46.0 GB38 tok/s803K ctx

dense

gemma 3 27b it

C44

27B48.2 GB34 tok/s704K ctx

dense

Qwen3.5 35B A3B

C44

35B54.0 GB26 tok/s524K ctx

dense

stabilityai japanese stablelm instruct beta 70b

C44

70B79.5 GB13 tok/s221K ctx

dense

cognitivecomputations Dolphin Mistral 24B Venice Edition

C44

24B46.0 GB38 tok/s803K ctx

dense

Mistral Small 24B Instruct 2501

C44

24B46.0 GB38 tok/s803K ctx

dense

Codestral 22B v0.1

C44

22B44.5 GB42 tok/s883K ctx

dense

Codestral 22B v0.1

C44

22B44.5 GB42 tok/s883K ctx

dense

BaichuanMed OCR 72B i1

C44

72B80.9 GB13 tok/s212K ctx

dense

mistral small 3.1 24b instruct 2503 hf

C44

24B46.0 GB38 tok/s803K ctx

dense

cognitivecomputations Dolphin3.0 R1 Mistral 24B

C44

24B46.0 GB38 tok/s803K ctx

dense

gemma 3 27b it

C44

27B48.2 GB34 tok/s704K ctx

dense

Qwen3.5 35B A3B

C44

35B54.0 GB26 tok/s524K ctx

dense

Dolphin Mistral GLM 4.7 Flash 24B Venice Edition Thinking Uncensored i1

C44

24B46.0 GB38 tok/s803K ctx

dense

HelpingAI2.5 5B i1

C44

5B32.2 GB70 tok/s4170K ctx

dense

Qwen3.5 4B

C44

4B31.5 GB56 tok/s5234K ctx

dense

Codestral 22B v0.1

C44

22B44.5 GB42 tok/s883K ctx

dense

internlm2 5 20b chat

C44

20B43.1 GB46 tok/s980K ctx

dense

internlm2 limarp chat 20b

C44

20B43.1 GB46 tok/s980K ctx

dense

Codestral RAG 19B Pruned i1

C44

19B42.4 GB48 tok/s1036K ctx

dense

gemma 3 4b it

C44

4B31.5 GB56 tok/s5234K ctx

dense

internlm2 math plus 20b i1

C44

20B43.1 GB46 tok/s980K ctx

dense

Codestral 22B v0.1 IMat

C44

22B44.5 GB42 tok/s883K ctx

dense

Codestral 21B Pruned i1

C44

21B43.8 GB44 tok/s929K ctx

dense

gemma 3 4b it

C44

4B31.5 GB56 tok/s5234K ctx

dense

Qwen3 48B A4B Savant Commander Distill 12X Closed Open Heretic Uncensored

C44

48B63.5 GB19 tok/s360K ctx

dense

cognitivecomputations Dolphin Mistral 24B Venice Edition

C44

24B46.0 GB38 tok/s803K ctx

dense

Qwen 3 0.6B

C44

0.6B29.8 GB8 tok/s33K ctx

dense

Codestral 22B v0.1 i1

C44

22B44.5 GB42 tok/s883K ctx

dense

Hermes 4.3 36B

C44

36B54.7 GB25 tok/s507K ctx

dense

Llama 3.2 1B

C44

1B29.6 GB14 tok/s128K ctx

dense

EXAONE 4.0 32B

C44

32B51.8 GB29 tok/s581K ctx

dense

aya expanse 32b heretic MPOA i1

C44

32B51.8 GB29 tok/s581K ctx

dense

Baichuan M2 32B Q4 K M

C44

32B51.8 GB29 tok/s581K ctx

dense

baichuan inc Baichuan M2 32B

C44

32B51.8 GB29 tok/s581K ctx

dense

Llama 3.2 3B Instruct

C43

3B31.1 GB42 tok/s6991K ctx

dense

Qwen2.5 3B Instruct

C43

3B30.7 GB42 tok/s7006K ctx

dense

Llama 3.2 3B Instruct

C43

3B30.7 GB42 tok/s7006K ctx

dense

Ministral 3 3B Instruct 2512

C43

3B30.7 GB42 tok/s7006K ctx

dense

HELVETE 3B

C43

3B30.7 GB42 tok/s7006K ctx

dense

Hermes 3 Llama 3.2 3B

C43

3B30.7 GB42 tok/s7006K ctx

dense

stablelm zephyr 3b

C43

3B30.7 GB42 tok/s7006K ctx

dense

StarCoder2 3B

C43

3B30.7 GB42 tok/s7006K ctx

dense

AI21 Jamba Reasoning 3B

C43

3B30.7 GB42 tok/s7006K ctx

dense

stablelm 3b 4e1t

C43

3B30.7 GB42 tok/s7006K ctx

dense

ai21labs AI21 Jamba Reasoning 3B

C43

3B30.7 GB42 tok/s7006K ctx

dense

ai21labs AI21 Jamba2 3B

C42

3B30.7 GB42 tok/s7006K ctx

dense

HelpingAI 3B hindi i1

C42

3B30.7 GB42 tok/s7006K ctx

dense

AI21 Jamba2 3B

C42

3B30.7 GB42 tok/s7006K ctx

dense

HelpingAI 3B hindi

C42

3B30.7 GB42 tok/s7006K ctx

dense

AI21 Jamba2 3B i1

C42

3B30.7 GB42 tok/s7006K ctx

dense

EXAONE 3.5 2.4B Instruct

C42

2.4B30.3 GB34 tok/s8778K ctx

dense

gemma 2 2b it

C42

2B30.4 GB28 tok/s10522K ctx

dense

gemma 2b

C42

2B30.0 GB28 tok/s10551K ctx

dense

Gemmasutra Mini 2B v1

C42

2B30.0 GB28 tok/s10551K ctx

dense

Qwen 3.5 0.6B

C42

0.6B29.8 GB8 tok/s131K ctx

dense

gemma 2 2b it

C42

2B30.0 GB28 tok/s10551K ctx

dense

StarCoder2 3B

C41

3B30.8 GB42 tok/s16K ctx

dense

Qwen2.5 1.5B Instruct

C41

1.5B29.6 GB21 tok/s14095K ctx

dense

DeepSeek R1 Distill Qwen 1.5B

C41

1.5B29.6 GB21 tok/s14095K ctx

dense

Yi Coder 1.5B Chat

C41

1.5B29.6 GB21 tok/s14095K ctx

dense

stablelm 2 zephyr 1.6b

C40

1.6B29.7 GB22 tok/s13209K ctx

dense

logos16v2 stablelm2 1.6b i1

C40

1.6B29.7 GB22 tok/s13209K ctx

dense

Yi Coder 1.5B

C40

1.5B29.6 GB21 tok/s14095K ctx

dense

Falcon H1 1.5B Instruct

C40

1.5B29.6 GB21 tok/s14095K ctx

dense

F Tier -- Can't Run (35 models)

Too heavy for this hardware.

TinyLlama 1.1B Chat v1.0

D40

1.1B29.3 GB15 tok/s19251K ctx

dense

Qwen 2.5 0.5B

D40

0.5B29.0 GB7 tok/s131K ctx

dense

EXAONE 4.0 1.2B

D40

1.2B29.4 GB17 tok/s17640K ctx

dense

Llama 3.2 1B Instruct Q8 0

D40

1B29.5 GB14 tok/s21156K ctx

dense

TinyLlama 1.1B Chat v0.3

D40

1.1B29.3 GB15 tok/s19251K ctx

dense

TinyLlama 1.1B Chat v0.6

D40

1.1B29.3 GB15 tok/s19251K ctx

dense

Llama 3.2 1B Instruct

D39

1B29.3 GB14 tok/s21185K ctx

dense

gemma 3 1b it

D39

1B29.3 GB14 tok/s21185K ctx

dense

TinyLlama 1.1B Chat v1.0 imatrix

D39

1.1B29.3 GB15 tok/s19251K ctx

dense

Falcon3 1B Instruct abliterated

D39

1B29.3 GB14 tok/s21185K ctx

dense

SmolVLM 500M Instruct

D37

0.5B29.1 GB7 tok/s24858K ctx

dense

embeddinggemma 300M

D36

0.3B28.9 GB4 tok/s24884K ctx

dense

granite embedding 107m multilingual

D34

0.11B28.7 GB2 tok/s24913K ctx

dense

Falcon H1 Tiny 90M Instruct

D34

0.09B28.7 GB2 tok/s24915K ctx

dense

K EXAONE 236B A23B

D34

236B200.2 GB3 tok/s7K ctx

dense

Baichuan M3 235B

D33

235B199.4 GB3 tok/s7K ctx

dense

Baichuan M3 235B i1

D33

235B199.4 GB3 tok/s7K ctx

dense

Qwen3-Coder 480B A35B Instruct

480B324.2 GB4 tok/s4K ctx

moe

Qwen 3.5 397B A17B

397B273.6 GB7 tok/s4K ctx

moe

Mistral Large 3

675B445.7 GB3 tok/s4K ctx

moe

GLM-5

744B501.4 GB3 tok/s4K ctx

moe

GLM-5.1

754B507.5 GB3 tok/s4K ctx

moe

Kimi K2.5

1000B646.0 GB2 tok/s4K ctx

moe

Kimi K2.6

1000B646.0 GB2 tok/s4K ctx

moe

DeepSeek V3 671B

671B497.4 GB3 tok/s4K ctx

moe

DeepSeek V3.1 671B

671B497.4 GB3 tok/s4K ctx

moe

DeepSeek V4 Pro

1600B892.4 GB2 tok/s4K ctx

moe

DeepSeek R1 671B

671B497.4 GB3 tok/s4K ctx

moe

DeepSeek Coder V2 236B

236B231.1 GB12 tok/s4K ctx

moe

DeepSeek V2.5 236B

236B231.1 GB12 tok/s4K ctx

moe

Llama 4 Maverick 17B 128E

400B275.5 GB7 tok/s4K ctx

moe

Llama 3.1 405B

405B283.3 GB2 tok/s4K ctx

dense

DeepSeek V3.2

671B438.3 GB3 tok/s4K ctx

moe

GLM-5.2

753.3B507.1 GB3 tok/s4K ctx

moe

Qwen3.5 397B A17B

397B317.2 GB2 tok/s4K ctx

dense

Compare with...

See How Other Hardware Stacks Up

Check tier lists for similar GPUs and Apple Silicon configs

Mac Studio M2 Ultra 128GB

128 GB unified memory

View tier list

MacBook Pro M3 Max 128GB

128 GB unified memory

View tier list

MacBook Pro M4 Max 128GB

128 GB unified memory

View tier list

Mac Studio M1 Ultra 128GB

128 GB unified memory

View tier list

Full Mac Studio M3 Ultra 256GB page Compare this hardware