AI Compatibility Tier List

Mac Studio M1 Ultra 128GB

380 AI models ranked by how well they run on your 128 GB unified memory hardware. Best match: Qwen3-Coder-Next (score: 93).

380

Models tested

343

Can run

128 GB

unified memory

Best tok/s

Tier Distribution

S 26

A 65

B 56

C 196

F 37

S: 26A: 65B: 56C: 196F: 37

Post on X

S Tier -- Perfect Fit (26 models)

These models run flawlessly with headroom to spare.

Qwen3-Coder-Next

S93

80B65.0 GB30 tok/s256K ctx

moe

Qwen 3.5 122B A10B

S92

122B91.6 GB27 tok/s20K ctx

moe

Qwen3-Coder 30B A3B Instruct

S92

30.5B34.8 GB67 tok/s256K ctx

moe

Qwen 3.6 35B A3B

S92

35B40.2 GB56 tok/s219K ctx

moe

Qwen3-VL 30B A3B Instruct

S91

30B34.5 GB69 tok/s256K ctx

moe

Qwen 3.5 35B A3B

S91

35B37.5 GB61 tok/s131K ctx

moe

Mistral Small 4 119B

S91

119B92.7 GB29 tok/s14K ctx

moe

Qwen 2.5 VL 72B

S90

72B63.5 GB11 tok/s33K ctx

dense

Qwen 3 30B A3B

S89

30.5B34.8 GB67 tok/s131K ctx

moe

Qwen 3.5 27B

S89

27B34.4 GB29 tok/s131K ctx

dense

Qwen 3.5 9B

S89

9B22.4 GB86 tok/s131K ctx

dense

Devstral 2 123B Instruct

S88

123B95.1 GB6 tok/s7K ctx

dense

Qwen 3 32B

S87

32B38.2 GB25 tok/s131K ctx

dense

Magistral Small 2507

S87

24B31.8 GB32 tok/s131K ctx

dense

Devstral Small 2 24B Instruct

S87

24B31.8 GB32 tok/s256K ctx

dense

Qwen 3.6 27B

S87

27B32.2 GB22 tok/s262K ctx

dense

GPT-OSS 20B

S87

21B30.0 GB85 tok/s128K ctx

moe

Nemotron Cascade 2 30B A3B

S87

30B36.0 GB68 tok/s262K ctx

moe

Qwen 3 14B

S87

14B25.7 GB56 tok/s131K ctx

dense

Qwen 3 8B

S87

8B21.8 GB97 tok/s131K ctx

dense

Command A 111B

S86

111B86.3 GB7 tok/s40K ctx

dense

Nemotron 3 Nano 30B

S86

30B35.5 GB26 tok/s131K ctx

dense

GPT-OSS 120B

S86

117B91.0 GB7 tok/s20K ctx

dense

Phi-4-reasoning-plus 14B

S86

14.7B26.7 GB53 tok/s33K ctx

dense

Leanstral 119B A6B

S86

119B96.1 GB25 tok/s9K ctx

moe

Devstral Small 1.1

S85

24B31.8 GB32 tok/s131K ctx

dense

A Tier -- Great Fit (65 models)

Excellent performance with comfortable memory margins.

Qwen 3.5 4B

A85

4B19.4 GB56 tok/s131K ctx

dense

Pixtral Large 124B

A85

124B95.7 GB6 tok/s5K ctx

dense

Gemma 4 31B

A85

30.7B48.1 GB19 tok/s64K ctx

dense

Gemma 4 26B A4B

A84

25.2B33.8 GB72 tok/s256K ctx

moe

Llama 3.3 70B

A84

70B62.3 GB11 tok/s114K ctx

dense

Nemotron Nano 8B

A82

8B21.6 GB97 tok/s131K ctx

dense

Phi-4 Mini Reasoning 4B

A82

3.8B18.5 GB53 tok/s131K ctx

dense

EXAONE 4.0 32B

A81

32B38.2 GB24 tok/s131K ctx

dense

Ministral 3 14B

A81

14B25.7 GB55 tok/s262K ctx

multimodal

Qwen 2.5 72B

A81

72B63.5 GB11 tok/s110K ctx

dense

Llama 3.1 70B

A81

70B62.3 GB11 tok/s114K ctx

dense

Qwen 2.5 32B

A80

32B38.2 GB24 tok/s131K ctx

dense

Codestral 2 25.08

A80

22B30.6 GB33 tok/s256K ctx

dense

Mistral Small 3.2 24B

A80

24B31.8 GB32 tok/s131K ctx

vision

Ornith 1.0 35B A3B

A80

35.1B36.4 GB61 tok/s262K ctx

moe

Gemma 3 27B

A80

27B42.4 GB21 tok/s87K ctx

dense

InternVL2 8B

A79

8B21.6 GB97 tok/s8K ctx

dense

CogVLM2 19B

A79

19B28.8 GB41 tok/s8K ctx

dense

LFM2 24B

A79

24B31.8 GB32 tok/s131K ctx

dense

Kimi Linear 48B A3B

A79

48B44.9 GB15 tok/s831K ctx

linear

OLMo 2 32B

A79

32B38.2 GB24 tok/s4K ctx

dense

Granite 4.1 30B

A79

30B36.9 GB26 tok/s131K ctx

dense

Phi-4 14B

A78

14B26.3 GB55 tok/s16K ctx

dense

Mistral Small 24B

A78

24B31.8 GB32 tok/s33K ctx

dense

Gemma 4 12B

A78

12B27.9 GB48 tok/s191K ctx

dense

DiffusionGemma 26B A4B

A78

25.8B34.1 GB69 tok/s262K ctx

moe

Ministral 3 8B

A77

8B21.8 GB97 tok/s262K ctx

multimodal

MiniCPM-V 2.6 8B

A77

8B21.6 GB97 tok/s2K ctx

dense

Qwen 2.5 14B

A77

14B26.2 GB56 tok/s131K ctx

dense

Mistral Small 3.1 24B

A77

24B31.8 GB32 tok/s131K ctx

dense

DeepSeek Coder V2 16B

A77

16B27.8 GB107 tok/s131K ctx

moe

Nemotron Nano 9B v2

A76

9B22.7 GB86 tok/s131K ctx

dense

SQLCoder 7B

A76

7B20.9 GB98 tok/s8K ctx

dense

Llama 4 Scout 17B 16E

A76

109B84.1 GB17 tok/s60K ctx

moe

Qwen 3 4B

A76

4B19.4 GB56 tok/s33K ctx

dense

Qwen 2.5 VL 7B

A76

7B19.8 GB98 tok/s33K ctx

dense

DeepSeek R1 Distill 70B

A76

70B62.3 GB11 tok/s114K ctx

dense

Granite Code 20B

A76

20B30.1 GB39 tok/s8K ctx

dense

Gemma 3 12B

A76

12B26.9 GB48 tok/s131K ctx

dense

Jina Embeddings v3

A75

0.57B17.8 GB8 tok/s8K ctx

dense

Magistral 7B

A75

7B20.9 GB98 tok/s8K ctx

dense

CodeGeeX 4 9B

A74

9B20.8 GB88 tok/s131K ctx

dense

Qwen 2.5 Coder 32B

A74

32B38.2 GB24 tok/s131K ctx

dense

BGE M3

A74

0.57B17.0 GB8 tok/s8K ctx

dense

StarCoder 15B

A74

15B40.2 GB42 tok/s8K ctx

dense

CodeLlama 13B Instruct

A73

13B34.9 GB56 tok/s16K ctx

dense

Granite Code 34B

A73

34B39.1 GB23 tok/s8K ctx

dense

Gemma 4 E4B

A73

8B20.9 GB74 tok/s128K ctx

dense

OLMo 2 13B

A73

13B25.1 GB60 tok/s33K ctx

dense

Command R 35B

A73

35B38.5 GB22 tok/s131K ctx

dense

Qwen 2.5 7B

A72

7B19.8 GB98 tok/s131K ctx

dense

Granite Code 8B

A72

8B21.6 GB97 tok/s8K ctx

dense

DevStral 7B

A72

7B20.9 GB98 tok/s8K ctx

dense

DeepSeek R1 Distill 32B

A72

32B38.2 GB24 tok/s33K ctx

dense

LLaVA 1.6 13B

A72

13B34.9 GB56 tok/s4K ctx

dense

MPT-30B-Instruct

A72

30B59.8 GB21 tok/s8K ctx

dense

Codestral Mamba 7B

A72

7B19.5 GB98 tok/s262K ctx

state-space

CodeLlama 7B Instruct

A71

7B26.8 GB98 tok/s16K ctx

dense

Nemotron 70B

A71

70B62.3 GB11 tok/s114K ctx

dense

StarCoder 7B

A71

7B26.3 GB98 tok/s8K ctx

dense

Granite 4.1 8B

A71

8B22.0 GB97 tok/s131K ctx

dense

DeepSeek R1 Distill 14B

A71

14B26.2 GB56 tok/s33K ctx

dense

LFM2.5 8B A1B

A71

8.5B20.1 GB207 tok/s128K ctx

moe

mxbai Embed Large

A71

0.34B16.9 GB5 tok/s1K ctx

dense

Pixtral 12B

A70

12B24.5 GB65 tok/s131K ctx

dense

B Tier -- Good Fit (56 models)

Solid performance, may need quantization or reduced context.

Snowflake Arctic Embed L

B70

0.34B16.9 GB5 tok/s1K ctx

dense

Nous Hermes 1.0

B70

9B32.4 GB80 tok/s16K ctx

dense

Qwen 2.5 Coder 3B

B69

3B18.8 GB42 tok/s131K ctx

dense

WizardLM 13B

B69

13B34.9 GB56 tok/s8K ctx

dense

Vicuna 13B

B69

13B34.9 GB56 tok/s4K ctx

dense

Nous Dolphin 13B

B69

13B36.3 GB48 tok/s16K ctx

dense

InternLM 7B

B69

7B26.8 GB98 tok/s8K ctx

dense

InternLM Chat 7B

B69

7B26.8 GB98 tok/s8K ctx

dense

Gemma 4 E2B

B68

5.1B18.4 GB71 tok/s128K ctx

dense

BGE Large EN v1.5

B68

0.34B16.9 GB5 tok/s1K ctx

dense

GLM-4 9B

B68

9B20.8 GB88 tok/s128K ctx

dense

Llama 3.1 8B

B68

8B21.6 GB97 tok/s128K ctx

dense

Falcon 40B Instruct

B68

40B45.4 GB17 tok/s8K ctx

dense

Solar 7B

B68

7B21.9 GB98 tok/s8K ctx

dense

WizardMath 7B

B67

7B20.9 GB98 tok/s4K ctx

dense

OLMo 2 7B

B67

7B20.9 GB98 tok/s4K ctx

dense

Gemma 2 27B

B67

27B42.4 GB21 tok/s8K ctx

dense

Nomic Embed Text v1.5

B66

0.14B15.6 GB2 tok/s8K ctx

dense

Qwen 2.5 Coder 7B

B66

7B19.8 GB98 tok/s131K ctx

dense

LLaVA 1.5 7B

B66

7B26.8 GB98 tok/s4K ctx

dense

Gemma 3 4B

B66

4B19.2 GB56 tok/s128K ctx

dense

Ministral 3 3B

B66

3B17.3 GB42 tok/s262K ctx

multimodal

Phi 4 Mini 4B

B65

4B18.6 GB56 tok/s128K ctx

dense

Qwen 3.5 2B

B64

2B17.7 GB28 tok/s131K ctx

dense

Mixtral 8x7B

B64

47B45.3 GB32 tok/s33K ctx

moe

Baichuan 13B

B64

13B36.3 GB48 tok/s8K ctx

dense

MPT-7B-Instruct

B64

7B26.8 GB98 tok/s8K ctx

dense

Baichuan 7B

B64

7B26.8 GB98 tok/s8K ctx

dense

Cerebras-GPT 13B

B64

13B33.8 GB48 tok/s112K ctx

dense

DeepSeek R1 Distill 7B

B63

7B19.8 GB98 tok/s33K ctx

dense

DeepSeek R1 Distill 8B

B63

8B21.6 GB97 tok/s33K ctx

dense

Command R+ 104B

B63

104B81.6 GB8 tok/s66K ctx

dense

Qwen 2.5 Math 72B

B63

72B63.5 GB11 tok/s4K ctx

dense

Samantha 7B

B63

7B20.9 GB98 tok/s4K ctx

dense

Qwen 2.5 3B

B63

3B18.8 GB42 tok/s131K ctx

dense

Phi 3 Mini 3.8B

B62

3.8B22.9 GB53 tok/s128K ctx

dense

Falcon 7B Instruct

B62

7B19.1 GB98 tok/s8K ctx

dense

Qwen 3 1.7B

B61

1.7B17.5 GB24 tok/s33K ctx

dense

Phi 3.5 Mini 4B

B61

4B23.0 GB56 tok/s128K ctx

dense

Gemma 2 9B

B61

9B25.3 GB64 tok/s8K ctx

dense

All MiniLM L6 v2

B61

0.02B15.0 GB2 tok/s0K ctx

dense

Llama 3.2 11B Vision

B61

11B23.4 GB71 tok/s16K ctx

vision

Qwen 2.5 Coder 14B

B61

14B26.2 GB56 tok/s131K ctx

dense

Granite 4.1 3B

B61

3B17.8 GB42 tok/s131K ctx

dense

Granite Code 3B

B60

3B19.0 GB42 tok/s8K ctx

dense

Qwen 2.5 Coder 1.5B

B60

1.5B16.1 GB21 tok/s33K ctx

dense

DeepSeek LLM 67B

B59

67B61.4 GB12 tok/s4K ctx

dense

Yi 1.5 34B

B59

34B39.1 GB23 tok/s4K ctx

dense

Yi Coder 9B

B59

9B21.7 GB87 tok/s131K ctx

dense

Mistral 7B Instruct v0.3

B59

7B20.9 GB98 tok/s8K ctx

dense

Mistral Nemo 12B

B59

12B24.5 GB65 tok/s128K ctx

dense

Phi 3 Medium 14B

B57

14B26.3 GB55 tok/s128K ctx

dense

InternLM 20B

B57

20B47.4 GB31 tok/s8K ctx

dense

Ministral 8B

B56

8B21.8 GB97 tok/s131K ctx

dense

Llama 3.2 3B

B56

3B18.3 GB42 tok/s128K ctx

dense

Codestral 22B

B56

22B30.6 GB35 tok/s33K ctx

dense

C Tier -- Tight Fit (196 models)

Runs with offloading or significant compromises.

DeepSeek R1 1.5B

C52

1.5B16.1 GB21 tok/s33K ctx

dense

Aya Expanse 32B

C52

32B36.7 GB25 tok/s8K ctx

dense

Granite 3.1 8B

C52

8B21.6 GB112 tok/s128K ctx

state-space

TinyLlama 1.1B

C51

1.1B15.7 GB15 tok/s4K ctx

dense

SmolLM3 3B

C51

3B18.5 GB42 tok/s128K ctx

dense

Yi 1.5 9B

C51

9B21.7 GB87 tok/s4K ctx

dense

Qwen 2.5 Math 7B

C51

7B19.8 GB98 tok/s4K ctx

dense

Llama 3.3 70B Instruct

C50

70B65.6 GB10 tok/s68K ctx

dense

Mixtral 8x22B

C50

141B104.2 GB9 tok/s4K ctx

moe

Solar Open 69B REAP i1

C50

69B64.9 GB11 tok/s70K ctx

dense

stabilityai japanese stablelm instruct beta 70b

C50

70B65.6 GB10 tok/s68K ctx

dense

BaichuanMed OCR 72B i1

C49

72B67.1 GB10 tok/s64K ctx

dense

Qwen 2.5 1.5B

C49

1.5B16.1 GB21 tok/s131K ctx

dense

OpenChat 7B

C49

7B20.9 GB98 tok/s8K ctx

dense

Vicuna 7B

C49

7B26.8 GB98 tok/s4K ctx

dense

Aya Expanse 8B

C48

8B21.6 GB97 tok/s8K ctx

dense

Yi 34B Chat

C48

34B39.1 GB23 tok/s200K ctx

dense

LFM2.5 350M

C48

0.35B15.1 GB5 tok/s128K ctx

dense

StableLM 2 12B

C48

12B35.6 GB48 tok/s4K ctx

dense

Dolphin 2.9 8B

C48

8B21.6 GB97 tok/s33K ctx

dense

OpenHermes 2.5 7B

C48

7B20.9 GB98 tok/s8K ctx

dense

Gemma 3 1B

C47

1B15.7 GB14 tok/s33K ctx

dense

Qwen3 48B A4B Savant Commander Distill 12X Closed Open Heretic Uncensored

C47

48B49.6 GB15 tok/s137K ctx

dense

Zephyr 7B Beta

C47

7B20.9 GB98 tok/s33K ctx

dense

StarCoder2 15B

C47

15B26.7 GB45 tok/s16K ctx

dense

Starling LM 7B

C47

7B20.9 GB98 tok/s8K ctx

dense

Meta Llama 3.1 8B Instruct

C47

8B20.5 GB90 tok/s1238K ctx

dense

llava llama 3 8b v1 1

C47

8B20.5 GB90 tok/s1238K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Meta Llama 3 8B Instruct

C47

8B20.5 GB90 tok/s1238K ctx

dense

Gemma 2 2B

C47

2B17.5 GB28 tok/s8K ctx

dense

DeepSeek R1 Distill Llama 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Qwen3.5 35B A3B

C47

35B40.2 GB21 tok/s219K ctx

dense

Dolphin3.0 Llama3.1 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Qwen3.5 9B

C47

9B21.3 GB80 tok/s1091K ctx

dense

Llama 3 8B Instruct 32k v0.1

C47

8B20.5 GB90 tok/s1238K ctx

dense

Llama 2 7B Chat

C47

7B19.8 GB98 tok/s1427K ctx

dense

Meta Llama 3.1 8B Instruct

C47

8B20.5 GB90 tok/s1238K ctx

dense

vntl llama3 8b v2

C47

8B20.5 GB90 tok/s1238K ctx

dense

Qwen3.5 9B Uncensored HauhauCS Aggressive

C47

9B21.3 GB80 tok/s1091K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Mistral 7B Instruct v0.2

C47

7B19.8 GB98 tok/s1427K ctx

dense

Mistral 7B Instruct v0.3

C47

7B19.8 GB98 tok/s1427K ctx

dense

DeepSeek R1 0528 Qwen3 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Qwen3 8B DeepSeek v3.2 Speciale Distill

C47

8B20.5 GB90 tok/s1238K ctx

dense

Qwen3.5 9B

C47

9B21.3 GB80 tok/s1091K ctx

dense

Hermes 3 Llama 3.1 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Qwen3.5 35B A3B

C47

35B40.2 GB21 tok/s219K ctx

dense

Hermes 2 Pro Llama 3 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

Dolphin3.0 Llama3.1 8B

C47

8B20.5 GB90 tok/s1238K ctx

dense

granite 8b code instruct 4k

C47

8B20.5 GB90 tok/s1238K ctx

dense

dolphin 2.9.4 llama3.1 8b

C46

8B20.5 GB90 tok/s1238K ctx

dense

Mistral 7B Instruct v0.3

C46

7B19.8 GB98 tok/s1427K ctx

dense

Yi Coder 9B Chat

C46

9B21.3 GB80 tok/s1091K ctx

dense

Hermes 2 Pro Mistral 7B

C46

7B19.8 GB98 tok/s1427K ctx

dense

glm 4 9b chat 1m

C46

9B21.3 GB80 tok/s1091K ctx

dense

openchat 3.6 8b 20240522 IMat

C46

8B20.5 GB90 tok/s1238K ctx

dense

zephyr 7B beta

C46

7B19.8 GB98 tok/s1427K ctx

dense

EXAONE 3.5 7.8B Instruct

C46

7.8B20.4 GB93 tok/s1272K ctx

dense

aya expanse 8b

C46

8B20.5 GB90 tok/s1238K ctx

dense

Nous Hermes 2 Mistral 7B DPO

C46

7B19.8 GB98 tok/s1427K ctx

dense

EXAONE 3.5 7.8B Instruct

C46

7.8B20.4 GB93 tok/s1272K ctx

dense

dolphin v2 8b abliterated i1

C46

8B20.5 GB90 tok/s1238K ctx

dense

Falcon H1R 7B

C46

7B19.8 GB98 tok/s1427K ctx

dense

EXAONE 3.5 7.8B Instruct i1

C46

7.8B20.4 GB93 tok/s1272K ctx

dense

DeepSeek LLM 7B

C46

7B26.3 GB98 tok/s4K ctx

dense

falcon mamba 7b instruct Q4 K M

C46

7B19.8 GB98 tok/s1427K ctx

dense

exaone 3.0 7.8b it

C46

7.8B20.4 GB93 tok/s1272K ctx

dense

aya expanse 8b orthogonal heretic i1

C46

8B20.5 GB90 tok/s1238K ctx

dense

zephyr 7B alpha

C46

7B19.8 GB98 tok/s1427K ctx

dense

speechless zephyr code functionary 7b

C46

7B19.8 GB98 tok/s1427K ctx

dense

Hermes 4.3 36B

C46

36B40.9 GB20 tok/s210K ctx

dense

Yi 1.5 9B Chat

C46

9B21.3 GB80 tok/s1091K ctx

dense

StarCoder2 7B

C46

7B19.8 GB98 tok/s1427K ctx

dense

Qwen3.5 27B

C46

27B34.4 GB27 tok/s308K ctx

dense

japanese stablelm instruct gamma 7B

C46

7B19.8 GB98 tok/s1427K ctx

dense

Qwen 2.5 Coder 0.5B

C46

0.5B15.2 GB7 tok/s131K ctx

dense

aya expanse 8b orthogonal heretic

C46

8B20.5 GB90 tok/s1238K ctx

dense

Falcon H1 7B Instruct

C46

7B19.8 GB98 tok/s1427K ctx

dense

Falcon H1R 7B

C46

7B19.8 GB98 tok/s1427K ctx

dense

gemma 3 27b it

C46

27B34.4 GB27 tok/s308K ctx

dense

Yi 1.5 6B Chat

C46

6B19.1 GB84 tok/s1679K ctx

dense

internlm2 5 1 8b chat i1

C46

8B20.5 GB90 tok/s1238K ctx

dense

internlm3 8b instruct abliterated i1

C46

8B20.5 GB90 tok/s1238K ctx

dense

Mamba Codestral 7B v0.1

C46

7B19.8 GB98 tok/s1427K ctx

dense

stabilityai japanese stablelm base gamma 7b

C46

7B19.8 GB98 tok/s1427K ctx

dense

gemma 3 12b it

C46

12B23.5 GB60 tok/s798K ctx

dense

baichuan2 7b chat

C46

7B19.8 GB98 tok/s1427K ctx

dense

SOLAR 10.7B Instruct v1.0 uncensored

C46

10.7B22.5 GB67 tok/s905K ctx

dense

DiscoPOP zephyr 7b gemma

C46

7B19.8 GB98 tok/s1427K ctx

dense

Yi 9B Coder i1

C46

9B21.3 GB80 tok/s1091K ctx

dense

stablelm 2 zephyr 1 6b

C46

6B19.1 GB84 tok/s1679K ctx

dense

Nous Hermes 2 SOLAR 10.7B

C46

10.7B22.5 GB67 tok/s905K ctx

dense

starcoder2 7b

C46

7B19.8 GB98 tok/s1427K ctx

dense

Qwen3.5 122B A10B

C46

122B88.8 GB7 tok/s20K ctx

dense

zephyr 7b beta Mistral 7B Instruct v0.2

C46

7B19.8 GB98 tok/s1427K ctx

dense

OpenChat 3.5 7B Qwen v2.0 i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

OpenChat 3.5 7B Starling v2.0 i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

internlm2 math plus 7b IMat

C46

7B19.8 GB98 tok/s1427K ctx

dense

CodeNinja 1.0 OpenChat 7B i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

HelpingAI2 9B

C46

9B21.3 GB80 tok/s1091K ctx

dense

Neural Chat 7B

C46

7B20.9 GB98 tok/s8K ctx

dense

internlm2 5 7b chat i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

OpenSafetyLab MD Judge v0 2 internlm2 7b

C46

7B19.8 GB98 tok/s1427K ctx

dense

MD Judge v0 2 internlm2 7b i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

EXAONE 4.0 32B

C46

32B38.0 GB23 tok/s247K ctx

dense

gemma 3 27b it

C46

27B34.4 GB27 tok/s308K ctx

dense

zephyr 7b gemma sft african ultrachat 100k

C46

7B19.8 GB98 tok/s1427K ctx

dense

jointpreferences mistral 7b sft helpful

C46

7B19.8 GB98 tok/s1427K ctx

dense

zephyr 7b dpo full i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

blossom v3 baichuan2 7b i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

DeepSeek R1 Distill Qwen 14B

C46

14B24.9 GB52 tok/s672K ctx

dense

HelpingAI2 9B i1

C46

9B21.3 GB80 tok/s1091K ctx

dense

aya expanse 32b heretic MPOA i1

C46

32B38.0 GB23 tok/s247K ctx

dense

Yi 1.5 6B

C46

6B19.4 GB84 tok/s4K ctx

dense

blossom v1 baichuan 7b i1

C46

7B19.8 GB98 tok/s1427K ctx

dense

HelpingAI 9B 200k i1

C46

9B21.3 GB80 tok/s1091K ctx

dense

Mistral Small 3.2 24B Instruct 2506

C46

24B32.2 GB30 tok/s357K ctx

dense

Yi 1.5 6B Chat

C46

6B19.1 GB84 tok/s1679K ctx

dense

HelpingAI 9B i1

C46

9B21.3 GB80 tok/s1091K ctx

dense

stablelm 2 1 6b chat imatrix

C46

6B19.1 GB84 tok/s1679K ctx

dense

cognitivecomputations Dolphin Mistral 24B Venice Edition

C46

24B32.2 GB30 tok/s357K ctx

dense

Baichuan M2 32B Q4 K M

C46

32B38.0 GB23 tok/s247K ctx

dense

Mistral Small 24B Instruct 2501

C46

24B32.2 GB30 tok/s357K ctx

dense

solar finalised finetuned Model 10.7B i1

C46

10.7B22.5 GB67 tok/s905K ctx

dense

baichuan inc Baichuan M2 32B

C46

32B38.0 GB23 tok/s247K ctx

dense

mistral small 3.1 24b instruct 2503 hf

C46

24B32.2 GB30 tok/s357K ctx

dense

cognitivecomputations Dolphin3.0 R1 Mistral 24B

C46

24B32.2 GB30 tok/s357K ctx

dense

SOLAR 10.7B v1.0

C46

10.7B22.5 GB67 tok/s905K ctx

dense

HelpingAI2.5 10B i1

C46

10B22.0 GB72 tok/s974K ctx

dense

NousResearch Hermes 4 14B

C46

14B24.9 GB52 tok/s672K ctx

dense

Dolphin Mistral GLM 4.7 Flash 24B Venice Edition Thinking Uncensored i1

C46

24B32.2 GB30 tok/s357K ctx

dense

Phi 4 reasoning vision 15B

C46

15B25.6 GB48 tok/s622K ctx

dense

Solar Open 100B

C46

100B87.4 GB7 tok/s22K ctx

dense

Codestral 22B v0.1

C46

22B30.7 GB33 tok/s397K ctx

dense

Helply 10.2b chat i1

C46

10.2B22.1 GB71 tok/s953K ctx

dense

StarCoder2 15B

C46

15B25.6 GB48 tok/s622K ctx

dense

Solar Open 100B i1

C46

100B87.4 GB7 tok/s22K ctx

dense

StarCoder2 7B

C46

7B19.5 GB98 tok/s16K ctx

dense

Codestral 22B v0.1

C46

22B30.7 GB33 tok/s397K ctx

dense

HelpingAI2 6B

C46

6B19.1 GB84 tok/s1679K ctx

dense

HelpingAI2 6B i1

C46

6B19.1 GB84 tok/s1679K ctx

dense

Nemotron Mini 4B

C46

4B19.1 GB56 tok/s4K ctx

dense

GGUF SOLARized GraniStral 14B 2102 YeAM HCT 32QKV

C45

14B24.9 GB52 tok/s672K ctx

dense

Codestral 22B v0.1

C45

22B30.7 GB33 tok/s397K ctx

dense

starcoder2 15b instruct v0.1

C45

15B25.6 GB48 tok/s622K ctx

dense

internlm JanusCoder 14B

C45

14B24.9 GB52 tok/s672K ctx

dense

starcoder2 15b i1

C45

15B25.6 GB48 tok/s622K ctx

dense

cognitivecomputations Dolphin Mistral 24B Venice Edition

C45

24B32.2 GB30 tok/s357K ctx

dense

GGUF SOLARized GraniStral 14B 1902 YeAM HCT

C45

14B24.9 GB52 tok/s672K ctx

dense

starcoder2 15b instruct v0.1

C45

15B25.6 GB48 tok/s622K ctx

dense

Codestral 22B v0.1 IMat

C45

22B30.7 GB33 tok/s397K ctx

dense

internlm2 5 20b chat

C45

20B29.3 GB36 tok/s445K ctx

dense

HelpingAI 15B i1

C45

15B25.6 GB48 tok/s622K ctx

dense

internlm2 limarp chat 20b

C45

20B29.3 GB36 tok/s445K ctx

dense

Codestral 21B Pruned i1

C45

21B30.0 GB34 tok/s420K ctx

dense

internlm2 math plus 20b i1

C45

20B29.3 GB36 tok/s445K ctx

dense

Codestral 22B v0.1 i1

C45

22B30.7 GB33 tok/s397K ctx

dense

Codestral RAG 19B Pruned i1

C45

19B28.5 GB38 tok/s473K ctx

dense

HelpingAI2.5 5B i1

C45

5B18.4 GB70 tok/s2031K ctx

dense

Qwen3.5 4B

C45

4B17.6 GB56 tok/s2560K ctx

dense

gemma 3 4b it

C45

4B17.6 GB56 tok/s2560K ctx

dense

gemma 3 4b it

C44

4B17.6 GB56 tok/s2560K ctx

dense

Qwen 3 0.6B

C44

0.6B15.9 GB8 tok/s33K ctx

dense

Llama 3.2 1B

C44

1B15.8 GB14 tok/s128K ctx

dense

Llama 3.2 3B Instruct

C44

3B17.2 GB42 tok/s3426K ctx

dense

Qwen2.5 3B Instruct

C44

3B16.9 GB42 tok/s3441K ctx

dense

Llama 3.2 3B Instruct

C43

3B16.9 GB42 tok/s3441K ctx

dense

Ministral 3 3B Instruct 2512

C43

3B16.9 GB42 tok/s3441K ctx

dense

HELVETE 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

Hermes 3 Llama 3.2 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

stablelm zephyr 3b

C43

3B16.9 GB42 tok/s3441K ctx

dense

StarCoder2 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

AI21 Jamba Reasoning 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

stablelm 3b 4e1t

C43

3B16.9 GB42 tok/s3441K ctx

dense

ai21labs AI21 Jamba Reasoning 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

ai21labs AI21 Jamba2 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

HelpingAI 3B hindi i1

C43

3B16.9 GB42 tok/s3441K ctx

dense

AI21 Jamba2 3B

C43

3B16.9 GB42 tok/s3441K ctx

dense

HelpingAI 3B hindi

C43

3B16.9 GB42 tok/s3441K ctx

dense

AI21 Jamba2 3B i1

C43

3B16.9 GB42 tok/s3441K ctx

dense

EXAONE 3.5 2.4B Instruct

C42

2.4B16.5 GB34 tok/s4322K ctx

dense

gemma 2 2b it

C42

2B16.6 GB28 tok/s5174K ctx

dense

gemma 2b

C42

2B16.2 GB28 tok/s5203K ctx

dense

Gemmasutra Mini 2B v1

C42

2B16.2 GB28 tok/s5203K ctx

dense

gemma 2 2b it

C42

2B16.2 GB28 tok/s5203K ctx

dense

Qwen 3.5 0.6B

C42

0.6B15.9 GB8 tok/s131K ctx

dense

StarCoder2 3B

C42

3B17.0 GB42 tok/s16K ctx

dense

Qwen2.5 1.5B Instruct

C41

1.5B15.8 GB21 tok/s6965K ctx

dense

DeepSeek R1 Distill Qwen 1.5B

C41

1.5B15.8 GB21 tok/s6965K ctx

dense

Yi Coder 1.5B Chat

C41

1.5B15.8 GB21 tok/s6965K ctx

dense

stablelm 2 zephyr 1.6b

C41

1.6B15.9 GB22 tok/s6525K ctx

dense

logos16v2 stablelm2 1.6b i1

C41

1.6B15.9 GB22 tok/s6525K ctx

dense

Yi Coder 1.5B

C41

1.5B15.8 GB21 tok/s6965K ctx

dense

Falcon H1 1.5B Instruct

C40

1.5B15.8 GB21 tok/s6965K ctx

dense

TinyLlama 1.1B Chat v1.0

C40

1.1B15.5 GB15 tok/s9528K ctx

dense

F Tier -- Can't Run (37 models)

Too heavy for this hardware.

Qwen 2.5 0.5B

D40

0.5B15.2 GB7 tok/s131K ctx

dense

EXAONE 4.0 1.2B

D40

1.2B15.6 GB17 tok/s8727K ctx

dense

Llama 3.2 1B Instruct Q8 0

D40

1B15.7 GB14 tok/s10461K ctx

dense

TinyLlama 1.1B Chat v0.3

D40

1.1B15.5 GB15 tok/s9528K ctx

dense

TinyLlama 1.1B Chat v0.6

D40

1.1B15.5 GB15 tok/s9528K ctx

dense

Llama 3.2 1B Instruct

D40

1B15.5 GB14 tok/s10489K ctx

dense

gemma 3 1b it

D40

1B15.5 GB14 tok/s10489K ctx

dense

TinyLlama 1.1B Chat v1.0 imatrix

D39

1.1B15.5 GB15 tok/s9528K ctx

dense

Falcon3 1B Instruct abliterated

D39

1B15.5 GB14 tok/s10489K ctx

dense

SmolVLM 500M Instruct

D38

0.5B15.2 GB7 tok/s12324K ctx

dense

embeddinggemma 300M

D36

0.3B15.1 GB4 tok/s12350K ctx

dense

granite embedding 107m multilingual

D34

0.11B14.9 GB2 tok/s12379K ctx

dense

Falcon H1 Tiny 90M Instruct

D34

0.09B14.9 GB2 tok/s12381K ctx

dense

Qwen 3 235B A22B

235B160.9 GB4 tok/s4K ctx

moe

Qwen3-Coder 480B A35B Instruct

480B310.4 GB3 tok/s4K ctx

moe

Qwen 3.5 397B A17B

397B259.8 GB4 tok/s4K ctx

moe

Mistral Large 3

675B431.8 GB2 tok/s4K ctx

moe

GLM-5

744B487.6 GB2 tok/s4K ctx

moe

GLM-5.1

754B493.7 GB2 tok/s4K ctx

moe

Kimi K2.5

1000B632.2 GB2 tok/s4K ctx

moe

Kimi K2.6

1000B632.2 GB2 tok/s4K ctx

moe

DeepSeek V3 671B

671B483.6 GB2 tok/s4K ctx

moe

DeepSeek V3.1 671B

671B483.6 GB2 tok/s4K ctx

moe

DeepSeek V4 Pro

1600B878.6 GB2 tok/s4K ctx

moe

DeepSeek V4 Flash

284B174.0 GB7 tok/s4K ctx

moe

DeepSeek R1 671B

671B483.6 GB2 tok/s4K ctx

moe

DeepSeek Coder V2 236B

236B217.3 GB6 tok/s4K ctx

moe

DeepSeek V2.5 236B

236B217.3 GB6 tok/s4K ctx

moe

Llama 4 Maverick 17B 128E

400B261.7 GB4 tok/s4K ctx

moe

Llama 3.1 405B

405B269.5 GB2 tok/s4K ctx

dense

DeepSeek V3.2

671B424.5 GB2 tok/s4K ctx

moe

MiniMax M2.7

230B158.8 GB8 tok/s4K ctx

moe

GLM-5.2

753.3B493.3 GB2 tok/s4K ctx

moe

K EXAONE 236B A23B

236B186.3 GB2 tok/s4K ctx

dense

Baichuan M3 235B

235B185.6 GB2 tok/s4K ctx

dense

Baichuan M3 235B i1

235B185.6 GB2 tok/s4K ctx

dense

Qwen3.5 397B A17B

397B303.4 GB2 tok/s4K ctx

dense

Compare with...

See How Other Hardware Stacks Up

Check tier lists for similar GPUs and Apple Silicon configs

Mac Studio M2 Ultra 128GB

128 GB unified memory

View tier list

MacBook Pro M3 Max 128GB

128 GB unified memory

View tier list

MacBook Pro M4 Max 128GB

128 GB unified memory

View tier list

Mac Studio M3 Ultra 96GB

96 GB unified memory

View tier list

Full Mac Studio M1 Ultra 128GB page Compare this hardware