Comparar
Compara hardware para IA local con resultados adaptados a la carga de trabajo.
Operating mode: Balanced. Balanced for general local use. Keeps the ranking neutral across personal and serving workflows.
RTX 4090 24GB gana for coding in balanced mode
Basado en encaje del modelo, velocidad y calidad en las mejores recomendaciones.
RTX 4090 24GB
GanadorSDevstral Small 2 24B Instruct
llama.cppQ4_K_MTight fit
20.4 GB / 24.0 GB
40.0 tok/s40K ctx
SCodestral 2 25.08
llama.cppQ4_K_MRuns well
19.2 GB / 24.0 GB
41.7 tok/s48K ctx
SQwen 3.6 27B
llama.cppQ4_K_MTight fit
20.7 GB / 24.0 GB
20.2 tok/s69K ctx
RTX 4070 12GB
SQwen 3.5 9B
llama.cppQ4_K_MRuns well
9.8 GB / 12.0 GB
71.5 tok/s32K ctx
AGemma 4 E4B
llama.cppQ4_K_MRuns well
8.3 GB / 12.0 GB
55.7 tok/s63K ctx
ACodeGeeX 4 9B
llama.cppQ4_K_MRuns well
8.2 GB / 12.0 GB
69.3 tok/s116K ctx
Comparación rápida
| Métrica | RTX 4090 24GB | RTX 4070 12GB |
|---|---|---|
| Modelos que encajan | 3 | 3 |
| Promedio decodificación tok/s | 34.0 | 65.5 |
| Mejor puntuación de grado | 93 | 98 |