Qwen·Qwen 3 family

Qwen3 32B

Open WeightsDenseapache-2.0Released Apr 2025

Alibaba's Qwen3 32B dense language model with strong reasoning and multilingual capabilities, supporting function calling and code generation across diverse tasks.

Capabilities

chatcompletionfunction-callingreasoningcode-generation

Modalities

textcode

Context Window

131K tokens

Providers

available

Available from 5 providers

Cheapest

SiliconFlow

$0.32/1M tokens

Fastest

Groq

165ms TTFT

Alibaba Model Studio, Fireworks, Groq, Hugging Face Inference, SiliconFlow

Providers (5)

Sorted by total cost (input + output per 1M tokens). Click a row to view provider details.

Provider	Pricing (per 1M)	Rate Limits	Regions	Health	Latency
SiliconFlow	In: $0.16Out: $0.16	600 RPM / 1.0M TPM	ap-east-1global	Healthy	0ms
Hugging Face Inference	In: $0.18Out: $0.18	300 RPM / 500K TPM	us-east-1eu-west-1	Healthy	0ms
Fireworks	In: $0.20Out: $0.20	600 RPM / 1.0M TPM	us-east-1us-west-2	Healthy	0ms
Groq	In: $0.29Out: $0.39	30 RPM / 100K TPM	us-east-1	Healthy	165ms
Alibaba Model Studio	In: $0.56Out: $2.24	120 RPM / 500K TPM	us-east-1eu-west-1	Healthy	0ms

Quick Start

Use this model via SiliconFlow with an OpenAI-compatible SDK.

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.siliconflow.com/v1",
  apiKey: process.env.SILICONFLOW_API_KEY,
});

const response = await client.chat.completions.create({
  model: "Qwen/Qwen3-32B",
  messages: [
    { role: "user", content: "Hello!" }
  ],
});

console.log(response.choices[0].message.content);

Using SiliconFlow API • OpenAI-compatible SDK