Sube la velocidad estimada de decodificación alrededor de un 95%.
Te mueve a CUDA, que sigue teniendo la cobertura más amplia en IA local.
No es solo un salto de hardware. También te deja en un ecosistema de runtimes más limpio para LLMs locales.
~$999 MSRP