Edit Models filters

Inference Providers

HF Inference API

Misc

arxiv: 2407.14679

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

40

Full-text search

Active filters: 2407.14679

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Width-Base-4bits

3B • Updated Mar 23 • 2

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Width-Base-8bits

5B • Updated Mar 23 • 2

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Depth-Base-4bits

3B • Updated Mar 23 • 2

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Depth-Base-8bits

5B • Updated Mar 23 • 2

nis12ram/qwen2.5-0.5B-Instruct-pruned-Inshort

Text Generation • 0.3B • Updated Jun 18 • 5

Mungert/Minitron-4B-Base-GGUF

Text Generation • 4B • Updated 9 days ago • 323

Mungert/Llama-3.1-Minitron-4B-Width-Base-GGUF

Text Generation • 5B • Updated 9 days ago • 2.21k

Mungert/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Text Generation • 5B • Updated 9 days ago • 2.6k

Mungert/Nemotron-Mini-4B-Instruct-GGUF

Text Generation • 4B • Updated 9 days ago • 861

Mungert/Mistral-NeMo-Minitron-8B-Instruct-GGUF

8B • Updated 9 days ago • 1.02k