Vergleich

Lokale KI-Hardware mit workloadbezogener Auswertung vergleichen.

Operating mode: Balanced. Balanced for general local use. Keeps the ranking neutral across personal and serving workflows.

RTX 4090 24GB gewinnt for coding in balanced mode

Basierend auf Modelleignung, Geschwindigkeit und Qualität der Top-Empfehlungen.

RTX 4090 24GB

Gewinner
SDevstral Small 2 24B Instruct
llama.cppQ4_K_MTight fit
20.4 GB / 24.0 GB
40.0 tok/s40K ctx
SCodestral 2 25.08
llama.cppQ4_K_MRuns well
19.2 GB / 24.0 GB
41.7 tok/s48K ctx
SQwen 3.6 27B
llama.cppQ4_K_MTight fit
20.7 GB / 24.0 GB
20.2 tok/s69K ctx

RTX 4070 12GB

SQwen 3.5 9B
llama.cppQ4_K_MRuns well
9.8 GB / 12.0 GB
71.5 tok/s32K ctx
AGemma 4 E4B
llama.cppQ4_K_MRuns well
8.3 GB / 12.0 GB
55.7 tok/s63K ctx
ACodeGeeX 4 9B
llama.cppQ4_K_MRuns well
8.2 GB / 12.0 GB
69.3 tok/s116K ctx

Schnellvergleich

MetrikRTX 4090 24GBRTX 4070 12GB
Passende Modelle33
Durchschn. Decode tok/s34.065.5
Beste Bewertung9398