Qwen
Qwen 3.5 9B
なぜ推奨されるか
Qwen 3.5 9B is a specialized fit for Coding. It is a recent-generation family, which helps on current local SOTA workloads. It fits natively with comfortable headroom. Context coverage stays within the requested workload envelope. Known distribution channels: huggingface, ollama, lm-studio.
Capacity: Roomy · Bandwidth: Medium · Stack: Standard
Interactive: Good · Light API: Great · Bottleneck: Balanced
スコア
122.0
適合状態
Runs well
適合:Runs well、安全なコンテキスト 32K。
ランタイムサポート:native、cuda-local 上の GGUF 経由。
ランタイム
llama.cpp
アーティファクト
GGUF
量子化
q4-k-m
デコード
72 tok/s
安全なコンテキスト
32K
公式コンテキスト
131K
サポート
native
TTFT
2616 ms
重み:5.5 GB
KVキャッシュ:2.2 GB
バックエンド:cuda-local
Current limits
This setup is broadly balanced for this model.
No major red flags
This recommendation has enough memory headroom and acceptable estimated speed for the selected workload.
Best next improvements
スコア 122.0 はワークロード適合度、カタログの新鮮さ、適合安全性、コンテキストカバレッジ、アーティファクト選択、メモリ使用率、スループット、レイテンシを組み合わせています。