Duyntnet
TinyLlama 1.1B Chat v1.0 imatrix
Dados limitados disponíveis — algumas especificações podem estar incompletas ou estimadas.
0K tokensContextoUnknownLicença3 InicialQualidade
TinyLlama 1.1B Chat v1.0 imatrix (1.100000023841858B parameters) requires approximately 2.6 GB of VRAM with Q4_K_M quantization. For the best balance of quality and speed, we recommend hardware with at least 3 GB of VRAM.
Quick specs
Parameters1.1B
Architecturedense
Context0K tokens
Modalitytext
Min RAM0.4 GB
Rec. RAM0.7 GB (Q4_K_M)
LicenseUnknown
FamilyLlama
✓ Chat
Modelos relacionados
Escolhas rápidas
Melhor hardware
Melhores opções para TinyLlama 1.1B Chat v1.0 imatrix
Rodar este modelo
Opções de quantização
Estimativas de VRAM por nível de quantização
No hardware detected — fit column shows raw VRAM estimates
| Quant | Bits | VRAM | Quality | Fit |
|---|---|---|---|---|
Q2_K | 2 | 0.4 GB | Low | — |
Q3_K_S | 3 | 0.5 GB | Low | — |
NVFP4 | 4 | 0.6 GB | Medium | — |
Q4_K_M | 4 | 0.7 GB | Medium | — |
Q5_K_M | 5 | 0.8 GB | High | — |
Q6_K | 6 | 0.9 GB | High | — |
Q8_0 | 8 | 1.2 GB | Very High | — |
F16 | 16 | 2.3 GB | Maximum | — |
Compatibilidade de hardware
Estimativas de compatibilidade para todo o hardware
Computing compatibility...
Detalhamento de memória
Reference: RTX 2060 6GB
Weights0.7 GB
KV Cache0.1 GB
Runtime1.2 GB
Headroom0.6 GB
Perguntas frequentes
FAQ — TinyLlama 1.1B Chat v1.0 imatrix
Veja também