Mistral Nemo 12B Instruct

12B

Mistral AI

Mistral + NVIDIA collaboration. 128K context, excellent multilingual support.

⬇ 15.1K HF downloads♥ 117 likesbartowski/Mistral-Nemo-Instruct-2407-GGUF· stats from 6/24/2026

Consumer GPUMac / Apple Silicon

131K

Max Context

Quant Variants

GGUF Q6_K

Best Quality

99.1%

Accuracy Retained

Quantization Variants

Per-quant VRAM, quality loss, and inference speed on RTX 4090

Format	Level	BPW	VRAM	PPL Loss	Speed	Actions
GGUF	Q4_K_M	4.85	8.5 GB	3.1%	112 tok/s	Calc HF
GGUF	Q6_K	6.56	11.0 GB	0.9%	95 tok/s	Calc HF
AWQ	INT4	4	7.8 GB	4.4%	148 tok/s	Calc HF