--- title: "Czego uczy nas wyciek 512 000 linii kodu Claude Code?" description: "Analiza wycieku kodu źródłowego Claude Code: dwupoziomowy internet, Self-Healing Memory, YOLO Classifier, autoDream i nowe zasady Agent Engine Optimization." date: 2026-04-01 updated: 2026-04-03 category: AI tags: ["AI", "Claude Code", "AEO", "LLM", "SEO"] url: https://uper.pl/blog/wyciek-kodu-claude-code/ --- # Czego uczy nas wyciek 512 000 linii kodu Claude Code? Zdarzenie z 31 marca 2026 roku przejdzie do historii jako moment, w którym „klucze do królestwa" agentów AI trafiły do domeny publicznej. Przypadkowy wyciek **512 000 linii kodu TypeScript** (1 906 plików) narzędzia Claude Code odsłonił wewnętrzne mechanizmy systemu generującego 2,5 miliarda dolarów przychodu rocznie.^{1, 2} Incydent, będący wynikiem błędu w pliku `.npmignore` oraz usterki w bundlerze Bun (bug #28001), pozwolił badaczom na kompletną dekonstrukcję najbardziej zaawansowanej „uprzęży agentycznej" na rynku.^{2, 7} Choć Anthropic próbował usuwać kopie za pomocą DMCA, deweloper **Sigrid Jin** — najaktywniejszy użytkownik Claude na świecie — w kilka godzin stworzył porty w Pythonie i Rust (projekt `claw-code`), czyniąc architekturę permanentnym elementem ekosystemu.^{2, 6} Dla webdeveloperów i specjalistów SEO wyciek jest masterclass z tego, jak AI faktycznie „konsumuje" sieć. ## Dwupoziomowy internet: Wybrańcy i „Cenzura 125 znaków" Analiza narzędzia `WebSearchTool` ujawniła, że Claude nie widzi sieci jako równej płaszczyzny. Istnieje twardo zakodowana lista **85 uprzywilejowanych domen** (m.in. GitHub, Stack Overflow, MDN, AWS, Tailwind, React, Django), które cieszą się statusem zaufanych źródeł wiedzy.^{3, 5, 7} Dla całej reszty internetu zasady są bezwzględne: - **Limit 125 znaków:** Z witryn spoza „listy wybranych" Claude pobiera jedynie krótkie fragmenty (ok. 1–2 zdania), podczas gdy z witryn uprzywilejowanych wyciąga pełną treść bez limitów.^{3, 7} - **Twardy limit 100 KB:** Narzędzie `WebFetchTool` ma sztywny limit **100 KB** surowego tekstu na jedno pobranie strony. Jeśli artykuł jest dłuższy, wszystko poniżej tej granicy jest dla agenta po prostu niewidoczne.^{7, 17} - **Parafrazowanie przez Haiku:** Treść z „zwykłych" stron jest przetwarzana przez mniejszy model **Haiku**, pełniący rolę filtra *copyright hygiene* i tarczy przed injection. Model streszcza tekst przed podaniem go do modelu głównego (Sonnet/Opus), co niemal całkowicie eliminuje szansę na bezpośrednie cytowanie marki.^{5, 7} - **Śmierć sekcji <head>:** Parser Claude (oparty na `Turndown.js`) całkowicie odrzuca sekcję ``. Metadane, tagi Open Graph oraz dane JSON-LD Schema.org są niewidoczne dla agenta. Dla programisty to jasny sygnał: budowanie Schema.org z myślą o agentach AI to obecnie strata czasu — cała wartość semantyczna musi znaleźć się w ``.^{7, 14} - **Masakrowanie tabel:** Parser `Turndown.js` w konfiguracji Anthropic nie posiada wtyczki do obsługi tabel. To świadoma decyzja inżynieryjna o uproszczeniu formatu Markdown, nie błąd modelu — relacje między komórkami są gubione, czyniąc dane tabelaryczne bezużytecznymi dla agenta.^{7, 14} ## Skeptical Memory: architektura, która sobie nie ufa Najbardziej istotnym odkryciem dla architektów RAG jest system **Self-Healing Memory**, zaprojektowany do walki z „entropią kontekstu" — tendencją AI do halucynacji w długich sesjach. Claude stosuje trzy warstwy pamięci:^{2, 10} 1. **MEMORY.md** — lekki indeks wskaźników z twardym limitem **200 linii lub 25 KB** (~150 znaków na linię), stale obecny w oknie kontekstowym. Przechowuje jedynie *lokalizacje* informacji, nie same dane. 2. **Topic Files** — szczegółowa wiedza projektowa wczytywana selektywnie (*on-demand*), gdy indeks wskaże jej przydatność. 3. **Raw Transcripts** — surowe dane, których model nigdy nie czyta w całości, a jedynie przeszukuje poleceniem `grep`. Kluczem jest **Strict Write Discipline** — agent może zaktualizować swój indeks pamięci dopiero po potwierdzonym, poprawnym zapisie pliku na dysku. Co więcej, instrukcje systemowe nakazują modelowi traktować własną pamięć jedynie jako „wskazówkę", wymagając ponownej weryfikacji faktów względem kodu źródłowego przed podjęciem krytycznych działań.^{7, 10} Wyciek potwierdził również, że instrukcje z `CLAUDE.md` są **wstrzykiwane ponownie przy każdej zmianie tury** (*turn change*), a nie ładowane jednorazowo. Dla dewelopera to kluczowa uwaga kosztowa: każda linia tego pliku zużywa tokeny przy każdym kroku rozmowy — co oznacza, że rozbudowany `CLAUDE.md` realnie wpływa na koszt sesji.^{7, 19} ## Inżynieria pod maską Dla developerów wyciek dostarczył gotowych wzorców projektowych dla systemów agentycznych klasy enterprise. ### UI i wydajność Claude Code to pełnoprawna aplikacja zbudowana na **React 19** i silniku **Ink**, wykorzystująca układ **Yoga Layout** (Flexbox w terminalu).^{17, 20} - **Startup Speed < 50 ms:** Anthropic osiągnął to poprzez agresywne leniwe ładowanie (`dynamic import()`). Moduły takie jak gRPC (~700 KB) czy OpenTelemetry (~400 KB) są importowane dynamicznie dopiero, gdy są faktycznie potrzebne.^{17, 20} - **Double Buffering:** System wykorzystuje techniki z silników gier — podwójne buforowanie ekranu i specjalny optymalizator patchy ANSI — co pozwala na płynne wyświetlanie strumieniowanego tekstu przy 60 fps bez migotania terminala.²⁰ - **Równoległy prefetching:** Podczas gdy użytkownik widzi pierwszy render, agent w tle równolegle pobiera klucze z Keychaina i sprawdza status Git.¹⁷ ### Bezpieczeństwo i telemetria - **YOLO Classifier** — to nie proste reguły `if-else`, a szybki model ML (gated by `TRANSCRIPT_CLASSIFIER`), który analizuje przebieg rozmowy i automatycznie decyduje, czy agent może wykonać akcję bez pytania użytkownika o zgodę.^{2, 7, 18} - **KAIROS i autoDream** — autonomiczny demon działający w tle. Po 5 sesjach i 24 godzinach bezczynności uruchamia proces **autoDream** — konsolidację wspomnień, usuwanie sprzeczności logicznych i przepisywanie plików pamięci długoterminowej.^{5, 7, 12} - **BashSecurity** — każda komenda przechodzi przez **23 punkty kontrolne**. System blokuje 18 wbudowanych funkcji Zsh i broni się przed atakami typu *equals expansion* (`=curl`) czy wstrzykiwaniem białych znaków Unicode.^{7, 8, 18} - **Detekcja frustracji** — w pliku `userPromptKeywords.ts` odkryto filtry regex (m.in. „wtf", „shit", „fucking broken"), służące do śledzenia frustracji użytkownika jako kluczowego sygnału poprawy produktu.^{2, 7} ## Manifest Agent Engine Optimization (AEO) Na podstawie dekonstrukcji Claude Code, strona idealna pod RAG musi zostać zaprojektowana według nowych wytycznych: | Obszar | Strategia AEO / RAG | | :--- | :--- | | **Struktura tekstu** | Fragmentacja na „atomowe jednostki" (200–500 słów) z kluczowym faktem w pierwszym zdaniu sekcji (odwrócona piramida). | | **Markdown-First** | Rezygnacja z tabel HTML na rzecz list punktowanych i hierarchii nagłówków ATX (`#`), które parser `Turndown.js` zamienia bezbłędnie.^{5, 14} | | **Lokalizacja danych** | Porzucenie sekcji `` jako nośnika sygnałów dla AI. Wszystko, co istotne, musi znaleźć się w pierwszych akapitach ``.^{5, 6} | | **Optymalizacja cache** | Inżynierowie Claude używają markera `SYSTEM_PROMPT_DYNAMIC_BOUNDARY` — wszystko przed nim jest statyczne i cachowane globalnie. Stałe nagłówki sekcji pomagają AI w dopasowaniu cache (*prefix matching*), co czyni procesowanie strony tańszym dla użytkownika.^{19, 20} | | **Autorytet pośredni** | Obecność wewnątrz 85 domen Tier 1 (np. repozytoria GitHub, odpowiedzi na Stack Overflow, dokumentacje open-source) staje się ważniejsza niż tradycyjne SEO off-page. | ## Wnioski i alert bezpieczeństwa Wyciek ujawnił również wewnętrzną roadmapę modeli Anthropic: **Capybara** (Claude 4.6), **Fennec** (Opus 4.6) oraz potwierdzone prace nad wersjami **Opus 4.7** i **Sonnet 4.8**.^{1, 9} Odkryto także flagę `ANTI_DISTILLATION_CC`, która wstrzykuje „fałszywe narzędzia" do odpowiedzi, aby zatruwać dane treningowe konkurentów próbujących scrapować ruch API Claude.^{2, 15} Warto podkreślić rolę **Sigrid Jina**, który tworząc projekt `claw-code` (kompletny port w Pythonie i Rust), uczynił wyciek permanentnym elementem internetu. Nawet gdyby Anthropic zdołał usunąć oryginalne kopie, architektura Claude Code jest już otwartą wiedzą — nie do ukrycia.^{2, 6} Internet staje się środowiskiem multi-agentycznym, w którym głównym konsumentem treści nie jest człowiek, lecz autonomiczny agent. Sukces odniosą marki, które potrafią wniknąć do **trwałej pamięci** i „snów" systemów AI. --- **Ostrzeżenie bezpieczeństwa:** Równolegle z wyciekiem wykryto atak supply-chain na bibliotekę `axios` (wersje 1.14.1 / 0.30.4), zawierający trojana RAT. Jeśli pobrałeś mirrorowane repozytoria wycieku i uruchomiłeś `npm install` 31 marca — Twoja maszyna może być zagrożona. Zawsze weryfikuj sumy kontrolne i nie uruchamiaj niezweryfikowanych pakietów z nieoficjalnych źródeł.^{2, 8, 11} ## Źródła 1. **Anthropic Accidentally Leaked Claude Code Source — Decrypt** [https://decrypt.co/362917/anthropic-accidentally-leaked-claude-code-source-internet-keeping-forever](https://decrypt.co/362917/anthropic-accidentally-leaked-claude-code-source-internet-keeping-forever) 2. **Claude Code Source Leak Megathread — r/ClaudeAI** [https://www.reddit.com/r/ClaudeAI/comments/1s9d9j9/claude_code_source_leak_megathread/](https://www.reddit.com/r/ClaudeAI/comments/1s9d9j9/claude_code_source_leak_megathread/) 3. **Claude Code Has 85 Approved Websites That Get Full Access — r/ChatGPT** [https://www.reddit.com/r/ChatGPT/comments/1s9hrzp/claude_code_has_85_approved_websites_that_get/](https://www.reddit.com/r/ChatGPT/comments/1s9hrzp/claude_code_has_85_approved_websites_that_get/) 4. **Arbiter: Detecting Interference in LLM Agent System Prompts — ResearchGate** [https://www.researchgate.net/publication/401772364_Arbiter_Detecting_Interference_in_LLM_Agent_System_Prompts](https://www.researchgate.net/publication/401772364_Arbiter_Detecting_Interference_in_LLM_Agent_System_Prompts) 5. **Claude Code Web Tools — mikhail.io** [https://mikhail.io/2025/10/claude-code-web-tools/](https://mikhail.io/2025/10/claude-code-web-tools/) 6. **Claude Code's source code appears to have leaked: here's what we know — VentureBeat** [https://venturebeat.com/technology/claude-codes-source-code-appears-to-have-leaked-heres-what-we-know](https://venturebeat.com/technology/claude-codes-source-code-appears-to-have-leaked-heres-what-we-know) 7. **The Great Claude Code Leak of 2026 — dev.to** [https://dev.to/varshithvhegde/the-great-claude-code-leak-of-2026-accident-incompetence-or-the-best-pr-stunt-in-ai-history-3igm](https://dev.to/varshithvhegde/the-great-claude-code-leak-of-2026-accident-incompetence-or-the-best-pr-stunt-in-ai-history-3igm) 8. **Claude Code Source Code Has Been Leaked via a Map File — r/ClaudeAI** [https://www.reddit.com/r/ClaudeAI/comments/1s8ifm6/claude_code_source_code_has_been_leaked_via_a_map/](https://www.reddit.com/r/ClaudeAI/comments/1s8ifm6/claude_code_source_code_has_been_leaked_via_a_map/) 9. **Claude Code Source Code Leak — Economic Times** [https://economictimes.com/news/international/us/claude-code-source-code-leak](https://economictimes.com/news/international/us/claude-code-source-code-leak) 10. **Memory — Claude Code Documentation** [https://code.claude.com/docs/en/memory](https://code.claude.com/docs/en/memory) 11. **Anthropic Claude Code Source Leak — Cybernews** [https://cybernews.com/security/anthropic-claude-code-source-leak/](https://cybernews.com/security/anthropic-claude-code-source-leak/) 12. **Claude Code Source Leak — Technical Analysis — alex000kim.com** [https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/](https://alex000kim.com/posts/2026-03-31-claude-code-source-leak/) 13. **Claude Code's source just leaked — I extracted its multi-agent orchestration system — r/LocalLLaMA** [https://www.reddit.com/r/LocalLLaMA/comments/1s8xj2e/claude_codes_source_just_leaked_i_extracted_its/](https://www.reddit.com/r/LocalLLaMA/comments/1s8xj2e/claude_codes_source_just_leaked_i_extracted_its/) 14. **HTML to Markdown MCP Server — GitHub** [https://github.com/levz0r/html-to-markdown-mcp](https://github.com/levz0r/html-to-markdown-mcp) 15. **Claude Code Leak Discussion (ANTI_DISTILLATION_CC) — Hacker News** [https://news.ycombinator.com/item?id=47585239](https://news.ycombinator.com/item?id=47585239) 16. **Claude Code Leak Exposes Many of Anthropic's Secrets — Techzine** [https://techzine.eu/blogs/applications/140121/claude-code-leak-exposes-many-of-anthropics-secrets/](https://techzine.eu/blogs/applications/140121/claude-code-leak-exposes-many-of-anthropics-secrets/) 17. **Deep Analysis of Claude Code Source Code (1): Overall Architecture — NETMIND** [https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)](https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)) 18. **Deep Analysis of Claude Code Source Code (2): Security Mechanism — NETMIND** [https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)](https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)) 19. **Claude Code Source Code Deep Analysis (3): Prompt System and Context Construction — NETMIND** [https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)](https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)) 20. **Claude Code Source Analysis (4): Performance optimization and user experience — NETMIND** [https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf)](https://blog.netmind.ai/article/Claude_Code_Source_Code_Deep_Analysis_(in_pdf))