Sentence Transformers
All MiniLM L6 v2
Actual207.7MDescargas4.6KMe gustaAug 2021Publicado0K tokensContextoApache 2.0Licencia64 BuenoCalidad
All MiniLM L6 v2 (0.023000000044703484B parameters) requires approximately 2.1 GB of VRAM with F16 quantization. For the best balance of quality and speed, we recommend hardware with at least 3 GB of VRAM.
Comenzar
— copia y pega para ejecutar en localCopy-paste commands to run All MiniLM L6 v2 on your machine.
Run
ollama run all-minilmQuick specs
Parameters0.02B
Architecturedense
Context0K tokens
Modalityembedding
Min RAM0 GB
Rec. RAM0 GB (F16)
LicenseApache 2.0
FamilyMiniLM
✓ RAG
About this model
Selecciones rápidas
Mejor hardware
Mejores opciones para All MiniLM L6 v2
Ejecutar este modelo
Opciones de cuantización
Estimaciones de VRAM por nivel de cuantización
No hardware detected — fit column shows raw VRAM estimates
| Quant | Bits | VRAM | Quality | Fit |
|---|---|---|---|---|
Q2_K | 2 | 0.0 GB | Low | — |
Q3_K_S | 3 | 0.0 GB | Low | — |
NVFP4 | 4 | 0.0 GB | Medium | — |
Q4_K_M | 4 | 0.0 GB | Medium | — |
Q5_K_M | 5 | 0.0 GB | High | — |
Q6_K | 6 | 0.0 GB | High | — |
Q8_0 | 8 | 0.0 GB | Very High | — |
F16 | 16 | 0.0 GB | Maximum | — |
Compatibilidad de hardware
Estimaciones de encaje en todo el hardware
Computing compatibility...
Desglose de memoria
Reference: RTX 2060 6GB
Weights0.0 GB
KV Cache0.3 GB
Runtime1.2 GB
Headroom0.6 GB
Preguntas frecuentes
FAQ — All MiniLM L6 v2
Ver también