Compare open-weights LLM inference
across 5 providers

Real pricing data, updated daily. Find the cheapest or fastest provider for your exact workload in seconds — no sign-up required.

Data last verified: May 17, 2026

Open workload calculator Browse all models

Workload calculator

Enter your monthly token volumes and constraints. The calculator ranks every provider by cost and flags rate limit or latency mismatches before you commit.

Try the calculator →

Top models by parameter count

Hermes 3 Llama 3.1 405B

405B params

131,072 ctx

llama-3

Llama 3.1 405B Instruct

405B params

131,072 ctx

llama-3

Nemotron-4 340B Instruct

340B params

4,096 ctx

nvidia-open-model

DeepSeek Coder V2 Instruct

Mixtral 8x22B Instruct

Tracked providers

Together AI Fireworks AI DeepInfra OpenRouter Groq

View all providers →

Compare open-weights LLM inferenceacross 5 providers

Workload calculator

Top models by parameter count

Tracked providers

Compare open-weights LLM inference
across 5 providers