Zdarzenie z 31 marca 2026 roku przejdzie do historii jako moment, w którym „klucze do królestwa” agentów AI trafiły do domeny publicznej. Przypadkowy wyciek 512 000 linii kodu TypeScript (1 906 plików) narzędzia Claude Code odsłonił wewnętrzne mechanizmy systemu generującego 2,5 miliarda dolarów przychodu rocznie.1, 2

Incydent, będący wynikiem błędu w pliku .npmignore oraz usterki w bundlerze Bun (bug #28001), pozwolił badaczom na kompletną dekonstrukcję najbardziej zaawansowanej „uprzęży agentycznej” na rynku.2, 7 Choć Anthropic próbował usuwać kopie za pomocą DMCA, deweloper Sigrid Jin — najaktywniejszy użytkownik Claude na świecie — w kilka godzin stworzył porty w Pythonie i Rust (projekt claw-code), czyniąc architekturę permanentnym elementem ekosystemu.2, 6 Dla webdeveloperów i specjalistów SEO wyciek jest masterclass z tego, jak AI faktycznie „konsumuje” sieć.

Dwupoziomowy internet: Wybrańcy i „Cenzura 125 znaków”

Analiza narzędzia WebSearchTool ujawniła, że Claude nie widzi sieci jako równej płaszczyzny. Istnieje twardo zakodowana lista 85 uprzywilejowanych domen (m.in. GitHub, Stack Overflow, MDN, AWS, Tailwind, React, Django), które cieszą się statusem zaufanych źródeł wiedzy.3, 5, 7

Dla całej reszty internetu zasady są bezwzględne:

  • Limit 125 znaków: Z witryn spoza „listy wybranych” Claude pobiera jedynie krótkie fragmenty (ok. 1–2 zdania), podczas gdy z witryn uprzywilejowanych wyciąga pełną treść bez limitów.3, 7
  • Twardy limit 100 KB: Narzędzie WebFetchTool ma sztywny limit 100 KB surowego tekstu na jedno pobranie strony. Jeśli artykuł jest dłuższy, wszystko poniżej tej granicy jest dla agenta po prostu niewidoczne.7, 17
  • Parafrazowanie przez Haiku: Treść z „zwykłych” stron jest przetwarzana przez mniejszy model Haiku, pełniący rolę filtra copyright hygiene i tarczy przed injection. Model streszcza tekst przed podaniem go do modelu głównego (Sonnet/Opus), co niemal całkowicie eliminuje szansę na bezpośrednie cytowanie marki.5, 7
  • Śmierć sekcji <head>: Parser Claude (oparty na Turndown.js) całkowicie odrzuca sekcję <head>. Metadane, tagi Open Graph oraz dane JSON-LD Schema.org są niewidoczne dla agenta. Dla programisty to jasny sygnał: budowanie Schema.org z myślą o agentach AI to obecnie strata czasu — cała wartość semantyczna musi znaleźć się w <body>.7, 14
  • Masakrowanie tabel: Parser Turndown.js w konfiguracji Anthropic nie posiada wtyczki do obsługi tabel. To świadoma decyzja inżynieryjna o uproszczeniu formatu Markdown, nie błąd modelu — relacje między komórkami są gubione, czyniąc dane tabelaryczne bezużytecznymi dla agenta.7, 14

Skeptical Memory: architektura, która sobie nie ufa

Najbardziej istotnym odkryciem dla architektów RAG jest system Self-Healing Memory, zaprojektowany do walki z „entropią kontekstu” — tendencją AI do halucynacji w długich sesjach. Claude stosuje trzy warstwy pamięci:2, 10

  1. MEMORY.md — lekki indeks wskaźników z twardym limitem 200 linii lub 25 KB (~150 znaków na linię), stale obecny w oknie kontekstowym. Przechowuje jedynie lokalizacje informacji, nie same dane.
  2. Topic Files — szczegółowa wiedza projektowa wczytywana selektywnie (on-demand), gdy indeks wskaże jej przydatność.
  3. Raw Transcripts — surowe dane, których model nigdy nie czyta w całości, a jedynie przeszukuje poleceniem grep.

Kluczem jest Strict Write Discipline — agent może zaktualizować swój indeks pamięci dopiero po potwierdzonym, poprawnym zapisie pliku na dysku. Co więcej, instrukcje systemowe nakazują modelowi traktować własną pamięć jedynie jako „wskazówkę”, wymagając ponownej weryfikacji faktów względem kodu źródłowego przed podjęciem krytycznych działań.7, 10

Wyciek potwierdził również, że instrukcje z CLAUDE.mdwstrzykiwane ponownie przy każdej zmianie tury (turn change), a nie ładowane jednorazowo. Dla dewelopera to kluczowa uwaga kosztowa: każda linia tego pliku zużywa tokeny przy każdym kroku rozmowy — co oznacza, że rozbudowany CLAUDE.md realnie wpływa na koszt sesji.7, 19

Inżynieria pod maską

Dla developerów wyciek dostarczył gotowych wzorców projektowych dla systemów agentycznych klasy enterprise.

UI i wydajność

Claude Code to pełnoprawna aplikacja zbudowana na React 19 i silniku Ink, wykorzystująca układ Yoga Layout (Flexbox w terminalu).17, 20

  • Startup Speed < 50 ms: Anthropic osiągnął to poprzez agresywne leniwe ładowanie (dynamic import()). Moduły takie jak gRPC (~700 KB) czy OpenTelemetry (~400 KB) są importowane dynamicznie dopiero, gdy są faktycznie potrzebne.17, 20
  • Double Buffering: System wykorzystuje techniki z silników gier — podwójne buforowanie ekranu i specjalny optymalizator patchy ANSI — co pozwala na płynne wyświetlanie strumieniowanego tekstu przy 60 fps bez migotania terminala.20
  • Równoległy prefetching: Podczas gdy użytkownik widzi pierwszy render, agent w tle równolegle pobiera klucze z Keychaina i sprawdza status Git.17

Bezpieczeństwo i telemetria

  • YOLO Classifier — to nie proste reguły if-else, a szybki model ML (gated by TRANSCRIPT_CLASSIFIER), który analizuje przebieg rozmowy i automatycznie decyduje, czy agent może wykonać akcję bez pytania użytkownika o zgodę.2, 7, 18
  • KAIROS i autoDream — autonomiczny demon działający w tle. Po 5 sesjach i 24 godzinach bezczynności uruchamia proces autoDream — konsolidację wspomnień, usuwanie sprzeczności logicznych i przepisywanie plików pamięci długoterminowej.5, 7, 12
  • BashSecurity — każda komenda przechodzi przez 23 punkty kontrolne. System blokuje 18 wbudowanych funkcji Zsh i broni się przed atakami typu equals expansion (=curl) czy wstrzykiwaniem białych znaków Unicode.7, 8, 18
  • Detekcja frustracji — w pliku userPromptKeywords.ts odkryto filtry regex (m.in. „wtf”, „shit”, „fucking broken”), służące do śledzenia frustracji użytkownika jako kluczowego sygnału poprawy produktu.2, 7

Manifest Agent Engine Optimization (AEO)

Na podstawie dekonstrukcji Claude Code, strona idealna pod RAG musi zostać zaprojektowana według nowych wytycznych:

ObszarStrategia AEO / RAG
Struktura tekstuFragmentacja na „atomowe jednostki” (200–500 słów) z kluczowym faktem w pierwszym zdaniu sekcji (odwrócona piramida).
Markdown-FirstRezygnacja z tabel HTML na rzecz list punktowanych i hierarchii nagłówków ATX (#), które parser Turndown.js zamienia bezbłędnie.5, 14
Lokalizacja danychPorzucenie sekcji <head> jako nośnika sygnałów dla AI. Wszystko, co istotne, musi znaleźć się w pierwszych akapitach <body>.5, 6
Optymalizacja cacheInżynierowie Claude używają markera SYSTEM_PROMPT_DYNAMIC_BOUNDARY — wszystko przed nim jest statyczne i cachowane globalnie. Stałe nagłówki sekcji pomagają AI w dopasowaniu cache (prefix matching), co czyni procesowanie strony tańszym dla użytkownika.19, 20
Autorytet pośredniObecność wewnątrz 85 domen Tier 1 (np. repozytoria GitHub, odpowiedzi na Stack Overflow, dokumentacje open-source) staje się ważniejsza niż tradycyjne SEO off-page.

Wnioski i alert bezpieczeństwa

Wyciek ujawnił również wewnętrzną roadmapę modeli Anthropic: Capybara (Claude 4.6), Fennec (Opus 4.6) oraz potwierdzone prace nad wersjami Opus 4.7 i Sonnet 4.8.1, 9 Odkryto także flagę ANTI_DISTILLATION_CC, która wstrzykuje „fałszywe narzędzia” do odpowiedzi, aby zatruwać dane treningowe konkurentów próbujących scrapować ruch API Claude.2, 15

Warto podkreślić rolę Sigrid Jina, który tworząc projekt claw-code (kompletny port w Pythonie i Rust), uczynił wyciek permanentnym elementem internetu. Nawet gdyby Anthropic zdołał usunąć oryginalne kopie, architektura Claude Code jest już otwartą wiedzą — nie do ukrycia.2, 6

Internet staje się środowiskiem multi-agentycznym, w którym głównym konsumentem treści nie jest człowiek, lecz autonomiczny agent. Sukces odniosą marki, które potrafią wniknąć do trwałej pamięci i „snów” systemów AI.


Ostrzeżenie bezpieczeństwa: Równolegle z wyciekiem wykryto atak supply-chain na bibliotekę axios (wersje 1.14.1 / 0.30.4), zawierający trojana RAT. Jeśli pobrałeś mirrorowane repozytoria wycieku i uruchomiłeś npm install 31 marca — Twoja maszyna może być zagrożona. Zawsze weryfikuj sumy kontrolne i nie uruchamiaj niezweryfikowanych pakietów z nieoficjalnych źródeł.2, 8, 11

Źródła

  1. Anthropic Accidentally Leaked Claude Code Source — Decrypt https://decrypt.co/362917/anthropic-accidentally-leaked-claude-code-source-internet-keeping-forever

  2. Claude Code Source Leak Megathread — r/ClaudeAI https://www.reddit.com/r/ClaudeAI/comments/1s9d9j9/claude_code_source_leak_megathread/

  3. Claude Code Has 85 Approved Websites That Get Full Access — r/ChatGPT https://www.reddit.com/r/ChatGPT/comments/1s9hrzp/claude_code_has_85_approved_websites_that_get/

  4. Arbiter: Detecting Interference in LLM Agent System Prompts — ResearchGate https://www.researchgate.net/publication/401772364_Arbiter_Detecting_Interference_in_LLM_Agent_System_Prompts

  5. Claude Code Web Tools — mikhail.io https://mikhail.io/2025/10/claude-code-web-tools/

  6. Claude Code’s source code appears to have leaked: here’s what we know — VentureBeat https://venturebeat.com/technology/claude-codes-source-code-appears-to-have-leaked-heres-what-we-know

  7. The Great Claude Code Leak of 2026 — dev.to https://dev.to/varshithvhegde/the-great-claude-code-leak-of-2026-accident-incompetence-or-the-best-pr-stunt-in-ai-history-3igm

  8. Claude Code Source Code Has Been Leaked via a Map File — r/ClaudeAI https://www.reddit.com/r/ClaudeAI/comments/1s8ifm6/claude_code_source_code_has_been_leaked_via_a_map/

  9. Claude Code Source Code Leak — Economic Times https://economictimes.com/news/international/us/claude-code-source-code-leak

  10. Memory — Claude Code Documentation https://code.claude.com/docs/en/memory

  11. Anthropic Claude Code Source Leak — Cybernews https://cybernews.com/security/anthropic-claude-code-source-leak/

  12. Claude Code Source Leak — Technical Analysis — alex000kim.com https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/

  13. Claude Code’s source just leaked — I extracted its multi-agent orchestration system — r/LocalLLaMA https://www.reddit.com/r/LocalLLaMA/comments/1s8xj2e/claude_codes_source_just_leaked_i_extracted_its/

  14. HTML to Markdown MCP Server — GitHub https://github.com/levz0r/html-to-markdown-mcp

  15. Claude Code Leak Discussion (ANTI_DISTILLATION_CC) — Hacker News https://news.ycombinator.com/item?id=47585239

  16. Claude Code Leak Exposes Many of Anthropic’s Secrets — Techzine https://techzine.eu/blogs/applications/140121/claude-code-leak-exposes-many-of-anthropics-secrets/

  17. Deep Analysis of Claude Code Source Code (1): Overall Architecture — NETMIND https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)

  18. Deep Analysis of Claude Code Source Code (2): Security Mechanism — NETMIND https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)

  19. Claude Code Source Code Deep Analysis (3): Prompt System and Context Construction — NETMIND https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)

  20. Claude Code Source Analysis (4): Performance optimization and user experience — NETMIND https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)