Unsloth

Qwen3.5 35B A3B

Name: Qwen3.5 35B A3B
Rating: 46 (81 reviews)
Author: Unsloth

HuggingFace

Begrenzte Daten verfügbar — einige Spezifikationen können unvollständig oder geschätzt sein.

1.7MDownloads694Likes0K TokenKontextUnknownLizenz5 EinstiegQualität

Qwen3.5 35B A3B (35B parameters) requires approximately 27.3 GB of VRAM with Q4_K_M quantization. For the best balance of quality and speed, we recommend hardware with at least 32 GB of VRAM.

Loslegen

— kopieren & einfügen, um lokal auszuführen

Copy-paste commands to run Qwen3.5 35B A3B on your machine.

Run

docker run --rm -it ghcr.io/ggerganov/llama.cpp:full \
  --hf-repo "unsloth/Qwen3.5-35B-A3B-GGUF" \
  --hf-file "Qwen3.5-35B-A3B-GGUF-Q4_K_M.gguf" \
  -c 4096 -ngl 99

Quick specs

Parameters35B

Architecturedense

Context0K tokens

Modalitytext

Min RAM13.7 GB

Rec. RAM21.3 GB (Q4_K_M)

LicenseUnknown

FamilyQwen

✓ Vision✓ Chat

Verwandte Modelle

Schnellauswahl

Bestes BudgetC

Mac mini M4 64GB~$1,099 — 7 tok/s

Beste GesamtwahlB

NVIDIA A100 40GB~$10,000 — 61 tok/s

Beste Hardware

Top-Empfehlungen für Qwen3.5 35B A3B

NVIDIA A100 40GBB

40 GB

RTX PRO 5000 Blackwell 48GBC

48 GB

MacBook Pro M4 Max 64GBC

Dieses Modell ausführen

Qwen3.5 35B A3B on NVIDIA A100 40GB Qwen3.5 35B A3B on RTX PRO 5000 Blackwell 48GB Qwen3.5 35B A3B on MacBook Pro M4 Max 64GB

Quantisierungsoptionen

VRAM-Schätzungen nach Quantisierungsstufe

No hardware detected — fit column shows raw VRAM estimates

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	13.7 GB	Low	—
Q3_K_S	3	17.2 GB	Low	—
NVFP4	4	19.6 GB	Medium	—
Q4_K_M	4	21.3 GB	Medium	—
Q5_K_M	5	25.2 GB	High	—
Q6_K	6	28.7 GB	High	—
Q8_0	8	37.5 GB	Very High	—
F16	16	71.8 GB	Maximum	—

Hardware-Kompatibilität

Eignungsschätzungen für alle Hardware

Rechner öffnen

Computing compatibility...

Speicheraufschlüsselung

Reference: RTX 2060 6GB

Weights21.3 GB

KV Cache4.1 GB

Runtime1.2 GB

Headroom0.6 GB

Häufig gestellte Fragen

FAQ — Qwen3.5 35B A3B

Siehe auch

Quantisierungsleitfaden Bewertungsmethodik Rechner öffnen