MetaMeta

Llama 3.2 11B Vision

レガシー
243.3Kダウンロード1.6KいいねSep 2024公開日16K トークンコンテキストCommunityライセンス36 基本品質

Llama 3.2 11B Vision (11B parameters) requires approximately 10.5 GB of VRAM with Q4_K_M quantization. For the best balance of quality and speed, we recommend hardware with at least 13 GB of VRAM.

はじめに

— コピー&ペーストでローカル実行

Copy-paste commands to run Llama 3.2 11B Vision on your machine.

Run

ollama run llama3.2-vision:11b

Quick specs

Parameters11B
Architecturevision
Context16K tokens
Modalitytext+vision
Min RAM4.3 GB
Rec. RAM6.7 GB (Q4_K_M)
LicenseCommunity
FamilyLlama Vision
Vision Chat

About this model

Llama 3.2 11B Vision is Meta's multimodal model that processes both text and images. Supports visual question answering, image captioning, and document understanding alongside standard text generation.

あなたのハードウェア

検出中...

おすすめ

最適なハードウェア

Llama 3.2 11B Visionのおすすめ

このモデルを実行

量子化オプション

量子化レベル別VRAM推定値

No hardware detected — fit column shows raw VRAM estimates

QuantBitsVRAMQualityFit
Q2_K
2
4.3 GB
Low
Q3_K_S
3
5.4 GB
Low
NVFP4
4
6.2 GB
Medium
Q4_K_M
4
6.7 GB
Medium
Q5_K_M
5
7.9 GB
High
Q6_K
6
9.0 GB
High
Q8_0
8
11.8 GB
Very High
F16
16
22.5 GB
Maximum

Quality benchmarks

Llama 3.2 11B Vision benchmark scores

Benchmark verified

Reasoning

MMLU-Pro
GPQA Diamond32.8%
MATH-50051.9%
ARC Challenge

Source: official · 2024-09-25

ハードウェア互換性

全ハードウェアの適合度推定

カリキュレーターを開く

Computing compatibility...

メモリ内訳

Reference: RTX 2060 6GB

Weights6.7 GB
KV Cache2.0 GB
Runtime1.2 GB
Headroom0.6 GB

よくある質問

FAQ — Llama 3.2 11B Vision

関連項目