Documentation Index
Fetch the complete documentation index at: /llms.txt
Use this file to discover all available pages before exploring further.

Docs

API Reference

Cookbook

Community
Blog
Cloud Console
Cloud Console

Python SDK
Node.js SDK

Get Started

Quickstart
Pricing
Rate Limits

Models

Choose a Model

Capabilities

Reasoning
Streaming Responses
Predicted Outputs
Preview
Structured Outputs
Tool Calling
Prompt Caching
Image Inputs
Preview
Payload Optimization

Dedicated Endpoints

Overview

Compatibility

OpenAI Compatibility
Migrate to GLM 4.7

Cloud Console

Overview
Projects
API Keys
Playground
Usage & Monitoring
Account & Billing

Resources

Designing for Cerebras
Integrations

Support

Service Status
Error Codes
Change Log
Deprecations
Policies
Preview Releases

Models

Model Catalog

OpenAI GPT OSS

This model excels at efficient reasoning across science, math, and coding applications. It’s ideal for real-time coding assistance, processing large documents for Q&A and summarization, agentic research workflows, and regulated on-premises workloads.

Was this page helpful?

Gemma 4 31B

Assistant

Responses are generated using AI and may contain mistakes.