Which Model Should I Choose?

Her görev için doğru modeli seçmek hem maliyeti hem kaliteyi önemli ölçüde etkiler. Claude Code birden fazla seviyede esnek model değiştirme sunar.

Available Models

Alias Model Ne İçin Input/1M Output/1M
opus Claude Opus 4.6 Karmaşık muhakeme, mimari, long-context $5.00 $25.00
sonnet Claude Sonnet 4.6 Günlük kodlama, dengeli performans $3.00 $15.00
haiku Claude Haiku 4.5 Basit görevler, hızlı işlemler $1.00 $5.00
opus[1m] Opus 4.6 + 1M context Büyük codebase’ler, uzun session’lar $10.00 $37.50
sonnet[1m] Sonnet 4.6 + 1M context Büyük codebase’ler $6.00 $22.50
opusplan Opus (plan) + Sonnet (execute) Karmaşık refactoring Hybrid Hybrid

Opus 4.6 (5 Şubat 2026): 1M token context window (beta), 128K max output, adaptive thinking ve agent teams destekli en güçlü model. Long context (>200K input) maliyeti $10/$37.50/MTok. Model ID: claude-opus-4-6.

Sonnet 4.6 (17 Şubat 2026): Sonnet 4.5’in yerini alan yeni dengeli model. Daha iyi agentic search performansı, daha az token tüketimi. Extended thinking, adaptive thinking ve 1M context window (beta) destekler. 64K max output. Model ID: claude-sonnet-4-6.

Fiyat farkı neden önemli: Tipik bir kodlama session’ı 50K-200K input ve 10K-50K output token tüketir. Haiku ile session başına $0.10-$0.45, Opus ile aynı session $0.50-$2.25 - 5 kat fark. Opus’u gerçekten zor problemler için saklayın.

When to Use Each Model

graph LR
    subgraph COST["Maliyet → Düşük ────────────────── Yüksek"]
        H["Haiku<br/>Keşif, arama, hızlı sorular"]
        S["Sonnet<br/>Günlük kodlama, bug fix, test"]
        O["Opus<br/>Mimari, zor debug, güvenlik"]
    end

    H --> S --> O

    style H fill:#132213,stroke:#22c55e,stroke-width:2px,color:#4ade80
    style S fill:#1c1208,stroke:#eab308,stroke-width:2px,color:#facc15
    style O fill:#2d1117,stroke:#f85149,stroke-width:2px,color:#f85149

Haiku: Keşif yapan subagent’lar, basit dosya aramaları, hızlı sorular. Opus’tan ~5 kat ucuz ve daha hızlı. Derin muhakeme gerektirmeyen arka plan görevleri için ideal.

Sonnet: Günlük geliştirmenin temel taşı. Feature geliştirme, bug düzeltme, test yazma, code review. Varsayılan modeliniz bu olmalı. Sonnet 4.6 daha iyi agentic search ve token verimliliği sunar.

Opus: Gerçekten karmaşık muhakeme için: mimari kararlar, zor debugging, karmaşık sistemleri anlama, güvenlik analizi. Opus 4.6 daha dikkatli planlar, agentic görevleri daha uzun sürdürür ve code review sırasında kendi hatalarını daha iyi yakalar. Pro subscription kullanıcıları Opus’a erişebilir.

Opusplan: Opus planlama + Sonnet uygulama hibrit modu. En iyi planı istediğiniz ama her düzenleme için Opus seviyesi muhakeme gerekmediği karmaşık refactoring’ler için mükemmel.

Switching Models

Session içinde:

> /model opus
> /model sonnet
> /model haiku

Başlangıçta:

claude --model opus

Environment ile:

export ANTHROPIC_MODEL=opus

Subagent’lar için:

export CLAUDE_CODE_SUBAGENT_MODEL=haiku

Extended Context

Özellikle brownfield projelerde bir geliştirme yapılacağı zaman planlama aşamasında Opus 1M token context’i enable etmek oldukça faydalı ve iyi sonuçlar veriyor.

Büyük codebase’ler veya uzun session’lar için 1M token context’i etkinleştirin:

claude --model sonnet[1m]
claude --model opus[1m]

Session içinde:

> /model sonnet[1m]
> /model opus[1m]

Opus 4.6 native 1M context destekli ilk Opus-class model. MRCR v2’nin 8-needle 1M varyantında %76 doğruluk (rakipler ~%18.5) ile long-context retrieval’da en güçlü model.

Extended context token başına daha pahalıdır (200K üstü input’ta 2x input, 1.5x output). Gerçekten ihtiyacınız olduğunda kullanın, varsayılan olarak değil.

Fast Mode

Fast mode aynı modelden önemli ölçüde daha hızlı çıktı sağlar; daha ucuz bir modele geçmez. /fast ile açıp kapatın.

  Standard Fast Mode
Input $5/MTok $30/MTok (6x)
Output $25/MTok $150/MTok (6x)

Fast mode fiyatlandırması tüm context window boyunca geçerlidir - long context ek ücreti yoktur. Prompt caching ve data residency çarpanlarıyla birleşir ama long context fiyatlandırmasıyla birleşmez. Batch API ile kullanılamaz.

Ne zaman kullanmalı:

Ne zaman kullanmamalı:

Fast mode artık tam 1M context window içerir (v2.1.50+).

Real-World Cost Examples

Görev Model Input Output Maliyet
Hızlı dosya arama Haiku 20K 2K $0.03
Bug fix + test Sonnet 100K 30K $0.75
Mimari review Opus 150K 50K $2.00
Tam gün session (Sonnet) Sonnet 500K 150K $3.75
Tam gün session (karışık) Haiku+Sonnet 500K 150K ~$2.00

Ortalama maliyet geliştirici başına günde ~$6; kullanıcıların %90’ı günlük $12 altında kalıyor.

VSCode Token & Cost Tracking Extensions

Extension Özellik Link
Claudemeter Pro/Max plan kota takibi, session limit, weekly limit, reset süreleri Marketplace
Claude Token Monitor 11 dil desteği, auto-plan detection, interactive dashboard Marketplace
Claude Code Usage Tracker Gerçek zamanlı token/maliyet takibi, session yönetimi Marketplace
Claude Code Status Bar Monitor Status bar’da token, maliyet ve mesaj sayısı Marketplace
Claude Code Usage Monitor Status bar’da usage ve maliyet izleme Marketplace

Claude Code Usage Tracking

Langfuse - Agentic App Observability

Langfuse, agentic uygulamaların model kullanımını, maliyetini ve davranışını trace eden open-source bir LLM observability platformudur.

Ne işe yarar:

Ne sunar:

Özellik Açıklama
Tracing LLM call, tool use, retrieval ve embedding’lerin uçtan uca trace kaydı
Cost Tracking Model bazında token tüketimi ve maliyet analizi
Prompt Management Prompt’ları merkezi olarak versiyonla, A/B test yap, cache’le
Evaluations LLM-as-a-judge, kullanıcı feedback, manuel labeling, custom eval pipeline’ları
Integrations OpenAI, LangChain, LlamaIndex, OpenTelemetry ve 50+ framework desteği

Neden önemli: Claude Code ile agentic uygulama geliştirdiğinizde, production’da hangi agent’ın hangi tool’u ne kadar token harcayarak çağırdığını, nerede hata yaptığını ve maliyetin nereye gittiğini görmek kritiktir. Langfuse tam olarak bu görünürlüğü sağlar.

Open-source (MIT lisansı), self-host edilebilir. 19.000+ GitHub star. Python ve JavaScript SDK’ları mevcut.

Kaynak: langfuse.com · GitHub · Video