---
title: "Claude Opus 4.7: 3× więcej zadań i nowy poziom xhigh"
description: "Anthropic wypuściło Claude Opus 4.7 — 13% poprawy w kodowaniu, 3× więcej rozwiązanych zadań produkcyjnych, nowy poziom xhigh, budżety zadań i ulepszona wizja."
date: 2026-04-17
category: AI
tags: ["AI", "Anthropic", "Claude", "LLM", "Programowanie"]
url: https://uper.pl/blog/claude-opus-4-7/
---

# Claude Opus 4.7 — agentyczna rewolucja Anthropic i nowa era długich zadań inżynieryjnych

16 kwietnia 2026 roku Anthropic udostępniło **Claude Opus 4.7** — kolejną iterację flagowego modelu, która koncentruje się na zadaniach wymagających długiego kontekstu, autonomicznego wnioskowania i dyscyplinowanego prowadzenia projektów programistycznych. Premiera przypada w momencie, gdy cała branża przesuwa ciężar z pojedynczych zapytań na **agentyczne przepływy pracy** — sesje, w których model przez wiele godzin planuje, pisze kod, poprawia błędy i raportuje postęp bez nadzoru człowieka. Opus 4.7 to wersja przystosowana właśnie do takich zastosowań: wolniejsza eskalacja błędów, lepsze korzystanie z pamięci między sesjami i wyraźnie silniejsze wyniki na benchmarkach inżynieryjnych.

![Claude Opus 4.7 — wyniki w benchmarkach kodowania i agentycznych](../../assets/images/blog/claude-opus-4-7-benchmarks.webp)

## Co nowego w Claude Opus 4.7

Nowy model utrzymuje ten sam poziom cenowy co poprzednik (5 USD za milion tokenów wejściowych i 25 USD za milion wyjściowych), ale wnosi kilka istotnych ulepszeń w warstwie architektury i sterowania rozumowaniem. To nie jest wyłącznie kosmetyczna aktualizacja — Anthropic deklaruje „znaczące lepsze podążanie za instrukcjami" i sugeruje, że część zespołów będzie musiała **ponownie dostroić swoje prompty**, aby w pełni wykorzystać potencjał modelu.

Najważniejsze zmiany względem Opus 4.6:

- **Poziom wysiłku `xhigh`** — nowa, pośrednia warstwa wnioskowania pomiędzy `high` a `max`, dająca większą kontrolę nad relacją kosztu do jakości odpowiedzi.
- **Budżety zadań (task budgets)** — parametr pozwalający ograniczyć zużycie tokenów w długich, agentycznych sesjach bez konieczności ręcznego przerywania.
- **Ulepszona wizja** — obsługa obrazów do 2576 px na dłuższej krawędzi, czyli ok. 3,75 megapiksela — ponad trzykrotnie więcej niż w poprzedniej wersji.
- **Komenda `/ultrareview`** — dedykowany tryb przeglądu kodu dla użytkowników Claude Pro i Max.
- **Auto mode** — autonomiczne podejmowanie decyzji rozszerzone na plan Max.
- **Zaktualizowany tokenizer** — lepsza obsługa tekstu, ale ten sam prompt może generować **1,0–1,35× więcej tokenów** niż dotychczas, co warto uwzględnić w budżetach API.

## Benchmarki: realne liczby, nie marketing

Anthropic uzupełnia komunikat konkretnymi wynikami pomiarów prowadzonych wspólnie z partnerami produkcyjnymi. To ważna zmiana tonu — zamiast zamkniętych ewaluacji akademickich firma chwali się liczbami z prawdziwych środowisk inżynieryjnych.

| Benchmark / partner | Opus 4.7 | Opus 4.6 |
| :--- | :--- | :--- |
| **Replit** (93-zadaniowy test kodowania) | +13% | poziom bazowy |
| **Rakuten** (zadania produkcyjne) | **3× więcej rozwiązań** | poziom bazowy |
| **CursorBench** | 70% sukcesu | 58% sukcesu |
| **GDPval-AA** (finanse/prawo) | state-of-the-art | niżej |
| **XBOW** (pentesting) | 98,5% skuteczności wizualnej | — |

Warto zwrócić uwagę na wynik Rakuten — trzykrotny wzrost liczby rozwiązanych zadań produkcyjnych oznacza nie tylko lepszą jakość kodu, ale także większą odporność modelu na „zawieszanie się" w długich przepływach. To bezpośrednio przekłada się na koszty operacyjne: mniej iteracji, mniej zmarnowanych tokenów, mniej poprawek ze strony człowieka.

## Agentyczność i pamięć międzysesyjna

Najważniejszy kierunek rozwoju Opusa 4.7 to **operowanie w długim horyzoncie czasowym**. Model został przystrojony do scenariuszy, w których agent pracuje przez godziny lub dni — pisze kod, uruchamia testy, wraca do zadania po przerwaniu i zachowuje spójność decyzji.

Najważniejsze usprawnienia w tym obszarze:

- **Lepsze wykorzystanie pamięci między sesjami** — model efektywniej korzysta z wcześniejszych notatek, logów i artefaktów projektu.
- **Koordynacja narzędzi** — sprawniejsze łączenie wywołań funkcji (tool use) w wielokrokowych planach.
- **Stabilność w długim kontekście** — mniej „halucynacji zmęczenia" przy pracy z dużymi repozytoriami.

Dla zespołów, które budują własne integracje z modelami klasy Claude — czy to przez API, czy przez Claude Code — oznacza to, że można agresywniej przesuwać logikę do samego modelu, zmniejszając liczbę warstw orkiestracji potrzebnych do utrzymania kontroli.

## Zmiany w tokenizatorze: co to oznacza dla rachunków API

Zaktualizowany tokenizer poprawia obsługę tekstu, ale ma praktyczną konsekwencję: **te same prompty mogą kosztować więcej**. Anthropic podaje współczynnik 1,0–1,35× w zależności od treści, a przy poziomie wysiłku `xhigh` i `max` model generuje także więcej tokenów wyjściowych — celowo, w imię większej niezawodności.

Co to oznacza w praktyce dla zespołów produkcyjnych:

1. **Przegląd budżetów miesięcznych** — zwłaszcza tam, gdzie używacie dużych kontekstów lub wielu równoległych agentów.
2. **Audyt długich promptów** — szczególnie wrażliwe są teksty w innych alfabetach i kod z dużą liczbą znaków specjalnych.
3. **Testy A/B cen jednostkowych** — mimo tych samych stawek za milion tokenów, efektywny koszt żądania może być wyższy o 10–35%.

## Bezpieczeństwo i podatność na prompt injection

Zewnętrzna ocena bezpieczeństwa modelu jest ostrożnie pozytywna. Opus 4.7 jest oceniany jako **„w dużej mierze dobrze zestrojony i godny zaufania"**, z wyraźnymi usprawnieniami w obszarze uczciwości oraz odporności na prompt injection — jeden z kluczowych wektorów ataku na systemy agentyczne.

Minusem jest nieco słabsza wydajność modelu w zakresie udzielania porad redukujących szkody (harm-reduction advice), co Anthropic otwarcie komunikuje w dokumentacji. Dla zespołów budujących produkty w obszarach regulowanych — zdrowie, finanse, prawo — oznacza to konieczność utrzymania dodatkowych warstw filtrów i walidacji, podobnie jak w przypadku [wcześniejszych modeli tej klasy](/blog/claude-mythos-klasa-capybara/).

## Dostępność i integracje

Claude Opus 4.7 jest dostępny od pierwszego dnia na wszystkich głównych platformach:

- **Claude.ai** — dla użytkowników Free, Pro, Max oraz Teams/Enterprise.
- **API Anthropic** — pod identyfikatorem `claude-opus-4-7`.
- **Amazon Bedrock** — w regionach obsługujących linię Claude.
- **Google Cloud Vertex AI** — pełna integracja z pipeline'ami GCP.
- **Microsoft Foundry** — nowy kanał dystrybucji w ekosystemie Microsoftu.

Dla użytkowników planów Pro i Max dostępna jest także komenda `/ultrareview`, uruchamiająca dedykowaną sesję przeglądu kodu, w której model poświęca większy budżet obliczeniowy na weryfikację zmian, wychwytywanie regresji i proponowanie uzasadnionych refaktoryzacji.

## Podsumowanie

Claude Opus 4.7 to model **ewolucyjny, ale w miejscach, które naprawdę mają znaczenie** dla zespołów produkcyjnych: długie sesje agentyczne, precyzyjne podążanie za instrukcjami, dyscyplina w wielogodzinnych projektach programistycznych oraz większa kontrola nad relacją kosztu do jakości dzięki nowemu poziomowi `xhigh`. Trzykrotny wzrost liczby rozwiązanych zadań produkcyjnych u partnerów takich jak Rakuten pokazuje, że poprawa wykracza poza benchmarki i przekłada się na realne oszczędności operacyjne.

Dla firm, które budują procesy oparte o [SEO wspierane przez AI](/blog/seo-w-erze-ai/) lub własne agentyczne narzędzia, Opus 4.7 jest jasnym sygnałem: warstwa modelu zyskuje kolejną porcję autonomii, a praca nad orkiestracją powinna coraz mocniej skupiać się na granicach i obserwowalności, a nie na ręcznym prowadzeniu modelu krok po kroku. Ostateczny test to oczywiście rachunek API po kilku tygodniach użycia — zwłaszcza biorąc pod uwagę zmiany w tokenizatorze.

## Źródła

1. **Introducing Claude Opus 4.7 — Anthropic**
[https://www.anthropic.com/news/claude-opus-4-7](https://www.anthropic.com/news/claude-opus-4-7)

2. **Claude Opus 4.7 System Card — Anthropic**
[https://www.anthropic.com/claude-opus-4-7-system-card](https://www.anthropic.com/claude-opus-4-7-system-card)

3. **Claude API Documentation — Anthropic**
[https://docs.anthropic.com/claude/docs](https://docs.anthropic.com/claude/docs)

4. **Amazon Bedrock — Claude Models**
[https://aws.amazon.com/bedrock/claude/](https://aws.amazon.com/bedrock/claude/)

5. **Vertex AI — Claude on Google Cloud**
[https://cloud.google.com/vertex-ai/generative-ai/docs/partner-models/claude](https://cloud.google.com/vertex-ai/generative-ai/docs/partner-models/claude)
