Sube la velocidad estimada de decodificación alrededor de un 281%.
Añade margen de memoria para más contexto y para que el modelo envejezca mejor.
No es solo un salto de hardware. También te deja en un ecosistema de runtimes más limpio para LLMs locales.
~$1,999 MSRP