Zdarzenie z 31 marca 2026 roku przejdzie do historii jako moment, w którym „klucze do królestwa” agentów AI trafiły do domeny publicznej. Przypadkowy wyciek 512 000 linii kodu TypeScript (1 906 plików) narzędzia Claude Code odsłonił wewnętrzne mechanizmy systemu generującego 2,5 miliarda dolarów przychodu rocznie.1, 2

Incydent, będący wynikiem błędu w pliku .npmignore oraz usterki w bundlerze Bun (bug #28001), pozwolił badaczom na kompletną dekonstrukcję najbardziej zaawansowanej „uprzęży agentycznej” na rynku.2, 7 Choć Anthropic próbował usuwać kopie za pomocą DMCA, deweloper Sigrid Jin — najaktywniejszy użytkownik Claude na świecie — w kilka godzin stworzył porty w Pythonie i Rust (projekt claw-code), czyniąc architekturę permanentnym elementem ekosystemu.2, 6 Dla webdeveloperów i specjalistów SEO wyciek jest masterclass z tego, jak AI faktycznie „konsumuje” sieć.

Dwupoziomowy internet: Wybrańcy i „Cenzura 125 znaków”

Analiza narzędzia WebSearchTool ujawniła, że Claude nie widzi sieci jako równej płaszczyzny. Istnieje twardo zakodowana lista 85 uprzywilejowanych domen (m.in. GitHub, Stack Overflow, MDN, AWS, Tailwind, React, Django), które cieszą się statusem zaufanych źródeł wiedzy.3, 5, 7

Dla całej reszty internetu zasady są bezwzględne:

  • Limit 125 znaków: Z witryn spoza „listy wybranych” Claude pobiera jedynie krótkie fragmenty (ok. 1–2 zdania), podczas gdy z witryn uprzywilejowanych wyciąga pełną treść bez limitów.3, 7
  • Parafrazowanie przez Haiku: Treść z „zwykłych” stron jest przetwarzana przez mniejszy model Haiku, pełniący rolę filtra copyright hygiene i tarczy przed injection. Model streszcza tekst przed podaniem go do modelu głównego (Sonnet/Opus), co niemal całkowicie eliminuje szansę na bezpośrednie cytowanie marki.5, 7
  • Śmierć sekcji <head>: Parser Claude (oparty na Turndown.js) całkowicie ignoruje metadane, tagi Open Graph oraz dane JSON-LD Schema.org. Cała wartość semantyczna musi znaleźć się w widocznej części sekcji <body>.7, 14
  • Masakrowanie tabel: Wyciek potwierdził, że domyślna konfiguracja parsera HTML → Markdown gubi relacje w strukturach tabelarycznych, czyniąc dane w nich zawarte bezużytecznymi dla agenta.7, 14

Skeptical Memory: architektura, która sobie nie ufa

Najbardziej istotnym odkryciem dla architektów RAG jest system Self-Healing Memory, zaprojektowany do walki z „entropią kontekstu” — tendencją AI do halucynacji w długich sesjach. Claude stosuje trzy warstwy pamięci:2, 10

  1. MEMORY.md — lekki indeks wskaźników (~150 znaków na linię), stale obecny w oknie kontekstowym. Przechowuje jedynie lokalizacje informacji, nie same dane.
  2. Topic Files — szczegółowa wiedza projektowa wczytywana selektywnie (on-demand), gdy indeks wskaże jej przydatność.
  3. Raw Transcripts — surowe dane, których model nigdy nie czyta w całości, a jedynie przeszukuje poleceniem grep.

Kluczem jest Strict Write Discipline — agent może zaktualizować swój indeks pamięci dopiero po potwierdzonym, poprawnym zapisie pliku na dysku. Co więcej, instrukcje systemowe nakazują modelowi traktować własną pamięć jedynie jako „wskazówkę”, wymagając ponownej weryfikacji faktów względem kodu źródłowego przed podjęciem krytycznych działań.7, 10

Inżynieria pod maską: YOLO, autoDream i BashSecurity

Dla developerów wyciek dostarczył gotowych wzorców projektowych dla systemów agentycznych klasy enterprise:

  • YOLO Classifier — ML-owy system decyzyjny (gated by TRANSCRIPT_CLASSIFIER), który analizuje przebieg rozmowy i automatycznie decyduje, czy agent może wykonać akcję bez pytania użytkownika o zgodę.2, 7
  • KAIROS i autoDream — autonomiczny demon działający w tle. Po 5 sesjach i 24 godzinach bezczynności uruchamia proces autoDream — konsolidację wspomnień, usuwanie sprzeczności logicznych i przepisywanie plików pamięci długoterminowej.5, 7, 12
  • BashSecurity — każda komenda przechodzi przez 23 punkty kontrolne. System blokuje 18 wbudowanych funkcji Zsh i broni się przed atakami typu equals expansion (=curl) czy wstrzykiwaniem białych znaków Unicode.7, 8
  • Detekcja frustracji — w pliku userPromptKeywords.ts odkryto filtry regex (m.in. „wtf”, „shit”, „fucking broken”), służące do śledzenia frustracji użytkownika jako kluczowego sygnału poprawy produktu.2, 7

Manifest Agent Engine Optimization (AEO)

Na podstawie dekonstrukcji Claude Code, strona idealna pod RAG musi zostać zaprojektowana według nowych wytycznych:

ObszarStrategia AEO / RAG
Struktura tekstuFragmentacja na „atomowe jednostki” (200–500 słów) z kluczowym faktem w pierwszym zdaniu sekcji (odwrócona piramida).
Markdown-FirstRezygnacja z tabel HTML na rzecz list punktowanych i hierarchii nagłówków ATX (#), które parser Turndown.js zamienia bezbłędnie.5, 14
Lokalizacja danychPorzucenie sekcji <head> jako nośnika sygnałów dla AI. Wszystko, co istotne, musi znaleźć się w pierwszych akapitach <body>.5, 6
Autorytet pośredniObecność wewnątrz 85 domen Tier 1 (np. repozytoria GitHub, odpowiedzi na Stack Overflow, dokumentacje open-source) staje się ważniejsza niż tradycyjne SEO off-page.

Wnioski i alert bezpieczeństwa

Wyciek ujawnił również wewnętrzną roadmapę modeli Anthropic: Capybara (Claude 4.6), Fennec (Opus 4.6) oraz potwierdzone prace nad wersjami Opus 4.7 i Sonnet 4.8.1, 9 Odkryto także flagę ANTI_DISTILLATION_CC, która wstrzykuje „fałszywe narzędzia” do odpowiedzi, aby zatruwać dane treningowe konkurentów próbujących scrapować ruch API Claude.2, 15

Internet staje się środowiskiem multi-agentycznym, w którym głównym konsumentem treści nie jest człowiek, lecz autonomiczny agent. Sukces odniosą marki, które potrafią wniknąć do trwałej pamięci i „snów” systemów AI.


Ostrzeżenie bezpieczeństwa: Równolegle z wyciekiem wykryto atak supply-chain na bibliotekę axios (wersje 1.14.1 / 0.30.4), zawierający trojana RAT. Jeśli pobrałeś mirrorowane repozytoria wycieku i uruchomiłeś npm install 31 marca — Twoja maszyna może być zagrożona. Zawsze weryfikuj sumy kontrolne i nie uruchamiaj niezweryfikowanych pakietów z nieoficjalnych źródeł.2, 8, 11

Źródła

  1. Anthropic Accidentally Leaked Claude Code Source — Decrypt https://decrypt.co/362917/anthropic-accidentally-leaked-claude-code-source-internet-keeping-forever

  2. Claude Code Source Leak Megathread — r/ClaudeAI https://www.reddit.com/r/ClaudeAI/comments/1s9d9j9/claude_code_source_leak_megathread/

  3. Claude Code Has 85 Approved Websites That Get Full Access — r/ChatGPT https://www.reddit.com/r/ChatGPT/comments/1s9hrzp/claude_code_has_85_approved_websites_that_get/

  4. Arbiter: Detecting Interference in LLM Agent System Prompts — ResearchGate https://www.researchgate.net/publication/401772364_Arbiter_Detecting_Interference_in_LLM_Agent_System_Prompts

  5. Claude Code Web Tools — mikhail.io https://mikhail.io/2025/10/claude-code-web-tools/

  6. Claude Code’s source code appears to have leaked: here’s what we know — VentureBeat https://venturebeat.com/technology/claude-codes-source-code-appears-to-have-leaked-heres-what-we-know

  7. The Great Claude Code Leak of 2026 — dev.to https://dev.to/varshithvhegde/the-great-claude-code-leak-of-2026-accident-incompetence-or-the-best-pr-stunt-in-ai-history-3igm

  8. Claude Code Source Code Has Been Leaked via a Map File — r/ClaudeAI https://www.reddit.com/r/ClaudeAI/comments/1s8ifm6/claude_code_source_code_has_been_leaked_via_a_map/

  9. Claude Code Source Code Leak — Economic Times https://economictimes.com/news/international/us/claude-code-source-code-leak

  10. Memory — Claude Code Documentation https://code.claude.com/docs/en/memory

  11. Anthropic Claude Code Source Leak — Cybernews https://cybernews.com/security/anthropic-claude-code-source-leak/

  12. Claude Code Source Leak — Technical Analysis — alex000kim.com https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/

  13. Claude Code’s source just leaked — I extracted its multi-agent orchestration system — r/LocalLLaMA https://www.reddit.com/r/LocalLLaMA/comments/1s8xj2e/claude_codes_source_just_leaked_i_extracted_its/

  14. HTML to Markdown MCP Server — GitHub https://github.com/levz0r/html-to-markdown-mcp

  15. Claude Code Leak Discussion (ANTI_DISTILLATION_CC) — Hacker News https://news.ycombinator.com/item?id=47585239

  16. Claude Code Leak Exposes Many of Anthropic’s Secrets — Techzine https://techzine.eu/blogs/applications/140121/claude-code-leak-exposes-many-of-anthropics-secrets/