Vergleich

Lokale KI-Hardware mit workloadbezogener Auswertung vergleichen.

Hardware A

Hardware BWorkloadOperating mode

Balanced for general local use. Keeps the ranking neutral across personal and serving workflows.

Operating mode: Balanced. Balanced for general local use. Keeps the ranking neutral across personal and serving workflows.

RTX 4090 24GB gewinnt for coding in balanced mode

Basierend auf Modelleignung, Geschwindigkeit und Qualität der Top-Empfehlungen.

SQwen 3.5 9B

llama.cppQ4_K_MRuns well

9.8 GB / 12.0 GB

71.5 tok/s32K ctx

AGemma 4 E4B

llama.cppQ4_K_MRuns well

8.3 GB / 12.0 GB

55.7 tok/s63K ctx

ACodeGeeX 4 9B

llama.cppQ4_K_MRuns well

8.2 GB / 12.0 GB

69.3 tok/s116K ctx

Gewinner

SDevstral Small 2 24B Instruct

llama.cppQ4_K_MTight fit

20.4 GB / 24.0 GB

40.0 tok/s40K ctx

SCodestral 2 25.08

llama.cppQ4_K_MRuns well

19.2 GB / 24.0 GB

41.7 tok/s48K ctx

SQwen 3.6 27B

llama.cppQ4_K_MTight fit

20.7 GB / 24.0 GB

20.2 tok/s69K ctx

Schnellvergleich