Większość biznesów wchodzi dziś w sztuczną inteligencję z jednym założeniem: „to zaoszczędzi nam mnóstwo czasu i pieniędzy”. Wyobrażamy sobie chatboty obsługujące klientów 24/7, dynamiczne opisy produktów w sklepach e-commerce i hiper-personalizację treści podnoszącą konwersję w czasie rzeczywistym.

Brzmi jak plan idealny. Zanim jednak rzucisz się w wir integracji AI we własnym serwisie, musisz poznać dwie historie, które w maju 2026 wstrząsnęły rynkiem.

Najpierw Microsoft — firma, która niemal zdefiniowała obecną falę AI — wewnętrznie odcina inżynierom dostęp do narzędzia Claude Code firmy Anthropic.1, 2 Tydzień później Uber publicznie przyznaje, że spalił cały roczny budżet AI w cztery miesiące, a jego CTO mówi wprost: „wróciliśmy do tablicy projektowej”.3, 4

Powód w obu przypadkach jest ten sam — i jest to dokładnie ten sam mechanizm, który może wyczyścić budżet Twojego sklepu lub portalu, jeśli wdrożysz AI bez planu.

Co dokładnie zrobił Microsoft?

25 maja 2026 The Next Web ujawnił, że Microsoft anuluje większość wewnętrznych licencji Claude Code w dywizji Experiences & Devices — czyli w zespołach odpowiedzialnych za Windows, Microsoft 365, Outlook, Teams i Surface.1 Inżynierowie tej dywizji mają do 30 czerwca 2026 (ostatni dzień roku fiskalnego Microsoftu) przejść na GitHub Copilot CLI — własne narzędzie Microsoftu, działające w trybie wiersza poleceń.1, 2

Co istotne:

  • Claude Code został wewnętrznie udostępniony w grudniu 2025 — eksperyment trwał więc mniej niż sześć miesięcy.1, 2
  • Microsoft nie zrywa relacji z Anthropic. Modele Claude pozostają dostępne w Microsoft Foundry oraz Microsoft 365 Copilot.2
  • Oficjalnym uzasadnieniem jest „ujednolicenie toolchainu”. EVP Rajesh Jha argumentuje, że Copilot CLI ma jedną kluczową przewagę: Microsoft może „bezpośrednio kształtować produkt poprzez GitHub”.2
  • W praktyce raporty branżowe wskazują, że Claude Code stał się wewnątrz Microsoftu „odrobinę zbyt popularny” — inżynierowie sięgali po niego chętniej niż po Copilota, co dramatycznie podbijało koszty tokenów.1, 2

To rzadki obraz: firma o przychodach przekraczających 200 miliardów dolarów cofa się z narzędzia, które obiektywnie działało dobrze — tylko dlatego, że za bardzo działało.

Uber: roczny budżet AI spalony w cztery miesiące

26 maja Fortune opublikował rozmowę z Praveen Neppalli Nagą, CTO Ubera, oraz Andrew Macdonaldem, COO firmy.3 Cyfry są zatrważające:

  • W grudniu 2025 Uber udostępnił Claude Code (a niedługo później również Cursor) zespołowi 5000 inżynierów.1, 5, 6
  • Adopcja eksplodowała: z 32% inżynierów w lutym do 84% w marcu 2026.1
  • Indywidualne koszty tokenów sięgnęły 500–2000 USD miesięcznie na inżyniera.1, 3
  • Roczny budżet Ubera na narzędzia AI dla inżynierii — szacowany przez raporty branżowe na ~3,4 mld USD — został wypalony w cztery miesiące.5, 6
  • Uber dodatkowo „podkręcił” zużycie wewnętrznym leaderboardem rankującym zespoły po liczbie wywołań AI — co dziś jest przykładową lekcją, jak nie projektować zachęt.6

Cytat, który stał się symbolem: „Wróciłem do tablicy projektowej, bo budżet, którego — jak sądziłem — będę potrzebował, już wyleciał w powietrze” — Praveen Neppalli Naga, CTO Uber.1, 3

COO Andrew Macdonald w tej samej rozmowie dodał, że problemem nie jest sama produktywność, lecz brak bezpośredniego połączenia między wydatkiem na AI a funkcjami dla użytkownika: „Jeśli nie potrafisz narysować bezpośredniej linii pomiędzy [liczbą] użytecznych funkcji dostarczanych użytkownikom a tymi wydatkami, ta wymiana staje się trudniejsza do uzasadnienia”.3

Dla porządku — Uber nie rezygnuje z AI. CEO Dara Khosrowshahi twierdzi, że 10% kodu commitowanego do repozytoriów Ubera jest dziś budowane przez autonomicznych agentów.3 Firma jednak musi przeprojektować model rozliczeń.

Paradoks tokenów: im lepsze narzędzie, tym wyższy rachunek

Obie historie ilustrują ten sam, niewygodny mechanizm rynku enterprise AI. Modele rozliczane są za tokeny — paczki tekstu wysłanego do AI (prompt) i wygenerowanego przez AI (odpowiedź). „Agentowe” narzędzia, takie jak Claude Code czy Cursor, same decydują, ile zapytań trzeba wysłać, by zrealizować cel użytkownika.1

Konsekwencja jest brutalna:

Im bardziej narzędzie się sprawdza, tym częściej inżynierowie po nie sięgają. Im częściej po nie sięgają, tym więcej tokenów konsumuje. Im więcej tokenów — tym wyższy rachunek.1

Microsoft i Uber dowiedli, że bez aktywnych mechanizmów kontroli kosztów ta krzywa nie wypłaszcza się sama. Sukces wdrożenia generuje porażkę budżetową.

I to nie jest problem dwóch firm — to ruch całej branży. Według raportów branżowych ceny narzędzi AI w USA wzrosły w 2026 o 20–37%, a GitHub od 1 czerwca 2026 zmienia model rozliczeń Copilota.5 Cały rynek przesuwa koszty na klienta końcowego.

Jeśli ciekawi Cię, co dokładnie dzieje się „pod maską” tych agentów i dlaczego potrafią one konsumować tak duże ilości tokenów, opisałem to w analizie wycieku 512 000 linii kodu Claude Code — wewnętrzna architektura agenta jest dużo bardziej rozbudowana, niż widać po stronie użytkownika.

Co to ma wspólnego z Twoim portalem lub sklepem internetowym?

„Zaraz, nie jestem Microsoftem ani Uberem. Moja strona to sklep z butami albo portal usługowy. Mnie to nie dotyczy.”

Dotyczy. Skala jest inna, mechanizm — identyczny.

Każde API językowego modelu AI (OpenAI, Anthropic, Google, Mistral) rozlicza się za tokeny. Wyobraź sobie, że wdrażasz na stronie zaawansowanego chatbota lub generator opisów produktów opartego na drogim modelu, bez zabezpieczeń. Wystarczy, że:

  1. Twój sklep zaliczy nagły skok ruchu z udanej kampanii w social media,
  2. Bot konkurencji zacznie zapętlać zapytania do Twojego asystenta,
  3. Użytkownicy zaczną traktować Twojego chatbota e-commerce jak darmowy ChatGPT do pisania wypracowań.

Efekt? Rano budzisz się z fakturą za API na kwotę kilku tysięcy złotych za weekend. To dokładnie ten sam mechanizm „im lepsze, tym droższe”, który zmusił Microsoft do wycofania się z Claude Code.

Jak mądrze wdrażać AI na stronie WWW, żeby nie zbankrutować?

Lekcja z Doliny Krzemowej jest jasna: amatorskie podpięcie API to tykająca bomba. Sukces wdrożenia AI w aplikacji webowej nie polega na ślepym zintegrowaniu „najmądrzejszego” modelu z rynku. Kluczem jest zoptymalizowana, bezpieczna architektura.

Co realnie ogranicza koszty:

  • Hybrydowy dobór modeli (Model Routing). Do prostych zapytań („jakie są koszty wysyłki?”) wykorzystujemy tańsze, błyskawiczne modele (np. klasy Haiku, Mini). Najdroższe rozwiązania angażujemy tylko do złożonych operacji wymagających głębokiego wnioskowania.
  • Semantic Caching (buforowanie semantyczne). Jeśli dziesięciu klientów pyta chatbota o to samo, system rozpoznaje podobieństwo intencji i serwuje gotową odpowiedź z pamięci podręcznej — koszt: 0 zł za powtórkę.
  • Architektura RAG (Retrieval-Augmented Generation). Zamiast pozwalać AI „halucynować”, zamykamy model w ścisłych ramach wiedzy o Twojej firmie. Krótszy kontekst = mniej tokenów = niższy rachunek.
  • Twarde limity (rate limiting) i alerty budżetowe. Zabezpieczenia na poziomie serwera, które fizycznie odcinają ruch w przypadku ataku botów lub przekroczenia dziennego progu. Ty decydujesz, ile maksymalnie chcesz wydać.
  • Routing po wartości użytkownika. Inaczej obsługujemy klienta zalogowanego z koszykiem o wartości 800 zł, inaczej anonima, który właśnie kliknął w czwartą wiadomość chatbota o ulubionych kotach. Microsoft i Uber zostali rozjechani właśnie tym, że każde użycie miało ten sam priorytet kosztowy.

Krótkie podsumowanie: tani vs drogi stack AI

ElementNaiwne wdrożenieArchitektura odporna na koszty
ModelJeden, najdroższy do wszystkiegoRouting: tani do prostych zadań, drogi do złożonych
CacheBrak — każde pytanie liczone osobnoSemantic cache na powtarzające się intencje
Wiedza„Otwarty” prompt, halucynacjeRAG ograniczony do Twoich danych
LimityBrak — sky is the limitRate limiting + twardy budżet dzienny + alerty
RyzykoFaktura kilka tysięcy zł po weekendziePrzewidywalne, kontrolowane koszty

Podsumowanie

Microsoft i Uber to dziś najlepsze studium przypadku tego, czego nie robić wdrażając AI w produkcie. Microsoft cofnął się z Claude Code w dywizji Experiences & Devices do 30 czerwca 2026, mimo że narzędzie obiektywnie sprawdzało się dobrze.1, 2 Uber publicznie przyznał, że jego CTO „wrócił do tablicy projektowej” po spaleniu rocznego budżetu w cztery miesiące.3

Wniosek dla każdego, kto planuje AI na własnej stronie czy w sklepie: architektura zarządzania kosztami musi być wbudowana od pierwszego dnia — routing modeli, semantic cache, RAG, rate limiting, alerty. Nie da się tego dokleić po fakcie, gdy faktura już przyszła.

Chcesz dołożyć AI do swojego sklepu lub portalu, ale z pełną kontrolą nad kosztami i ROI? Tworzę strony internetowe i aplikacje webowe nowej generacji — mądrze, bezpiecznie, skalowalnie.

Porozmawiajmy o AI w Twoim biznesie →

Często zadawane pytania

Czy Microsoft całkowicie zrywa współpracę z Anthropic?

Nie. Microsoft anuluje wewnętrzne licencje Claude Code w dywizji Experiences & Devices do 30 czerwca 2026, ale modele Claude pozostają dostępne w Microsoft Foundry oraz Microsoft 365 Copilot. To wycofanie z konkretnego, agentowego narzędzia — nie zerwanie relacji z Anthropic.

Na co Microsoft przenosi swoich inżynierów?

Na GitHub Copilot CLI — własne, command-line'owe narzędzie Microsoftu. Oficjalnym uzasadnieniem jest „ujednolicenie toolchainu". EVP Rajesh Jha wskazał kluczową przewagę: Microsoft może bezpośrednio kształtować produkt poprzez GitHub.

Ile kosztuje korzystanie z agentowego AI w skali enterprise?

Według CTO Ubera Praveena Neppalliego Nagi — 500–2000 USD miesięcznie na jednego inżyniera. Przy 5000 inżynierów to wystarczyło, żeby Uber wypalił szacowany na ~3,4 mld USD roczny budżet AI w cztery miesiące. To koszt narzędzi developerskich; chatbot na stronie WWW będzie tańszy, ale mechanizm „im więcej użyć, tym wyższy rachunek" jest identyczny.

Co to znaczy, że AI jest „rozliczane za tokeny"?

Token to paczka tekstu — średnio około czterech znaków lub fragment słowa. Płacisz osobno za prompt wysłany do AI i za odpowiedź przez nie wygenerowaną. Im dłuższy kontekst (np. cała historia rozmowy + załączone dokumenty) i im dłuższa odpowiedź, tym więcej tokenów i tym wyższy rachunek. Agentowe AI dodatkowo same decydują, ile zapytań wykonać — co potrafi wielokrotnie zwiększyć rachunek względem zwykłego chatu.

Jak zabezpieczyć budżet AI na własnej stronie lub w sklepie?

Cztery warstwy: routing modeli (tańsze modele do prostych zapytań, drogie tylko do złożonych), semantic caching (zapamiętywanie powtarzających się intencji i serwowanie odpowiedzi z cache), architektura RAG (ograniczenie kontekstu do Twoich danych — krótszy prompt, mniej tokenów), oraz twarde limity (rate limiting na poziomie serwera + dzienny budżet z alertami). Bez tych zabezpieczeń pojedynczy atak bota lub viralowy ruch potrafi wygenerować rachunek na kilka tysięcy złotych w weekend.

Czy ten problem dotyczy tylko Claude Code?

Nie — to ogólny problem agentowego AI rozliczanego za tokeny. Identyczny mechanizm występuje przy Cursor, GitHub Copilot, narzędziach OpenAI czy Google. Uber zresztą używał równolegle Claude Code i Cursora. Ceny narzędzi AI w USA wzrosły w 2026 o 20–37%, a GitHub od 1 czerwca 2026 zmienia model rozliczeń Copilota — cały rynek przesuwa koszty na klienta końcowego.

Źródła

  1. Microsoft’s quiet Claude Code retreat and the real cost of enterprise AI — The Next Web (25 maja 2026) https://thenextweb.com/news/microsoft-claude-code-retreat-ai-cost

  2. Microsoft cancels Claude Code licences after engineers use it too much — People Matters https://www.peoplematters.in/news/ai-and-emerging-tech/microsoft-cancels-claude-code-licences-after-engineers-use-it-too-much-49918

  3. Uber burned through its entire 2026 AI budget in four months — Fortune (26 maja 2026) https://fortune.com/2026/05/26/uber-coo-ai-spending-tokens-claude-code/

  4. Uber’s Anthropic AI Push Hits A Wall — CTO Says Budget Struggles Despite $3.4B Spend — Yahoo Finance https://finance.yahoo.com/sectors/technology/articles/ubers-anthropic-ai-push-hits-223109852.html

  5. Microsoft cancels Claude Code licenses as AI costs surge across the industry — Crypto Briefing https://cryptobriefing.com/microsoft-cancels-claude-code-ai-costs/

  6. Uber Spends Full 2026 AI Budget in 4 Months — Briefs.co https://www.briefs.co/news/uber-torches-entire-2026-ai-budget-on-claude-code-in-four-months/