Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

arxiv: 2407.14679

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

Misc with no match

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

34

Full-text search

Active filters: 2407.14679

nvidia/Nemotron-Mini-4B-Instruct

Text Generation • Updated Feb 14 • 2.38k • 164

nvidia/Minitron-8B-Base

Text Generation • Updated Feb 14 • 7.98k • 67

nvidia/Minitron-4B-Base

Text Generation • Updated Feb 14 • 1.45k • 134

mgoin/Minitron-8B-Base-FP8

Text Generation • Updated Jul 26, 2024 • 24 • 3

mgoin/Nemotron-4-340B-Base-hf

Text Generation • Updated Aug 8, 2024 • 13 • 1

mgoin/Nemotron-4-340B-Base-hf-FP8

Text Generation • Updated Aug 8, 2024 • 127 • 2

nvidia/Llama-3.1-Minitron-4B-Width-Base

Text Generation • Updated Feb 14 • 4.66k • 191

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Text Generation • Updated Feb 14 • 4.85k • 21

ThomasBaruzier/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 27, 2024 • 52 • 3

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Aug 22, 2024 • 7.85k • 173

IntervitensInc/Llama-3.1-Minitron-4B-Width-Base-chatml

Updated Aug 26, 2024 • 4 • 2

QuantFactory/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Aug 21, 2024 • 167 • 5

QuantFactory/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Updated Aug 22, 2024 • 96 • 1

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23, 2024 • 643 • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23, 2024

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24, 2024 • 38 • 1

QuantFactory/Minitron-4B-Base-GGUF

Updated Aug 24, 2024 • 27 • 1

QuantFactory/Minitron-8B-Base-GGUF

Updated Aug 24, 2024 • 28 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Sep 9, 2024 • 15

abiks/Nemotron-Mini-4B-Instruct-GGUF-Q8

Updated Sep 14, 2024 • 9 • 3

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

Updated Sep 26, 2024 • 3 • 1

QuantFactory/Nemotron-Mini-4B-Instruct-GGUF

Updated Sep 24, 2024 • 50 • 2

nvidia/Mistral-NeMo-Minitron-8B-Instruct

Text Generation • Updated Oct 9, 2024 • 4.28k • 76

QuantFactory/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 4, 2024 • 164 • 5

lucyknada/nvidia_Mistral-NeMo-Minitron-8B-Instruct-v3-exl2

Updated Oct 4, 2024

mav23/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 7, 2024 • 120 • 1

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Nov 5, 2024 • 59

da-fr/Mistral-NeMo-Minitron-8B-ARChitects-Full-bnb-4bit

Updated Dec 3, 2024 • 1.24k • 5

duyntnet/Nemotron-Mini-4B-Instruct-imatrix-GGUF

Text Generation • Updated Dec 5, 2024 • 498

duyntnet/Mistral-NeMo-Minitron-8B-Instruct-imatrix-GGUF

Text Generation • Updated Dec 12, 2024 • 136