Google

Gemma 4 31B

Open WeightsDenseapache-2.0Released Apr 2026

Google's flagship open-weight dense model with 31B parameters. All parameters active per forward pass. Ranks among top open models with strong performance on AIME 2026 (89.2%) and MMLU Pro (85.2%). Supports vision and extended context.

Capabilities

chatcompletionvisioncode-generationreasoning

Modalities

textimagecode

Context Window

262K tokens

Providers

available

Available from 4 providers

Cheapest

Google AI Studio

$0.00/1M tokens

Deep Infra, Google AI Studio, NVIDIA NIM, Together AI

Providers (4)

Sorted by total cost (input + output per 1M tokens). Click a row to view provider details.

Provider	Pricing (per 1M)	Rate Limits	Regions	Health	Latency
Google AI Studio	In: FreeOut: Free	15 RPM / 500K TPM	us-east-1eu-west-1global	Healthy	0ms
NVIDIA NIM	In: FreeOut: Free	100 RPM / 500K TPM	us-east-1us-west-2global	Healthy	0ms
Deep Infra	In: $0.10Out: $0.20	600 RPM / 1.0M TPM	us-east-1eu-west-1	Healthy	0ms
Together AI	In: $0.50Out: $0.50	600 RPM / 1.0M TPM	us-east-1us-west-2	Healthy	0ms

Quick Start

Use this model via Google AI Studio with an OpenAI-compatible SDK.

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.google-ai-studio.com/v1",
  apiKey: process.env.GOOGLE_AI_STUDIO_API_KEY,
});

const response = await client.chat.completions.create({
  model: "gemma-4-31b-it",
  messages: [
    { role: "user", content: "Hello!" }
  ],
});

console.log(response.choices[0].message.content);

Using Google AI Studio API • OpenAI-compatible SDK