Comparar

Compara hardware para IA local con resultados adaptados a la carga de trabajo.

Hardware A

Hardware BCarga de trabajoOperating mode

Balanced for general local use. Keeps the ranking neutral across personal and serving workflows.

Operating mode: Balanced. Balanced for general local use. Keeps the ranking neutral across personal and serving workflows.

RTX 4090 24GB gana for coding in balanced mode

Basado en encaje del modelo, velocidad y calidad en las mejores recomendaciones.

SQwen 3.5 9B

llama.cppQ4_K_MRuns well

9.8 GB / 12.0 GB

71.5 tok/s32K ctx

AGemma 4 E4B

llama.cppQ4_K_MRuns well

8.3 GB / 12.0 GB

55.7 tok/s63K ctx

ACodeGeeX 4 9B

llama.cppQ4_K_MRuns well

8.2 GB / 12.0 GB

69.3 tok/s116K ctx

Ganador

SDevstral Small 2 24B Instruct

llama.cppQ4_K_MTight fit

20.4 GB / 24.0 GB

40.0 tok/s40K ctx

SCodestral 2 25.08

llama.cppQ4_K_MRuns well

19.2 GB / 24.0 GB

41.7 tok/s48K ctx

SQwen 3.6 27B

llama.cppQ4_K_MTight fit

20.7 GB / 24.0 GB

20.2 tok/s69K ctx

Comparación rápida

Métrica	RTX 4070 12GB	RTX 4090 24GB
Modelos que encajan	3	3
Promedio decodificación tok/s	65.5	34.0
Mejor puntuación de grado	98	93