Klikając „Akceptuj wszystkie pliki cookie”, zgadzasz się na przechowywanie plików cookie na swoim urządzeniu w celu ułatwienia nawigacji po stronie, analizy korzystania ze strony oraz wspierania naszych działań marketingowych. Zobacz naszą Politykę prywatności, aby uzyskać więcej informacji.
Artykuł

Awaria AWS a ryzyko centralizacji usług

Davidson Consulting

Eksperci ds. zarządzania kryzysowego i ciągłości działania

Ta awaria pokazała, jak bardzo współczesne usługi internetowe i aplikacje są zależne od infrastruktury chmurowej, a także jak skomplikowane i szerokie mogą być skutki nawet pojedynczej wewnętrznej aktualizacji w takim systemie.‍

20 października 2025 roku doszło do poważnej awarii Amazon Web Services (AWS), jednej z największych na świecie platform chmurowych, która trwała kilka godzin i wpłynęła na globalny dostęp do wielu popularnych stron internetowych oraz aplikacji. Awaria rozpoczęła się około godziny 07:11 GMT w centrum danych AWS w Virginia – najstarszym i największym obiekcie tego typu należącym do Amazona.

Przyczyną problemu była błędna aktualizacja API usługi DynamoDB, bazy danych obsługującej dane użytkowników i systemy wielu aplikacji. Ta aktualizacja naruszyła działanie systemu DNS, który jest odpowiedzialny za tłumaczenie nazw domen na adresy IP, niezbędne do prawidłowego działania aplikacji. W efekcie setki usług, w tym 113 różnych usług AWS, przestały działać prawidłowo, co spowodowało awarie takich aplikacji i serwisów jak Snapchat, Pinterest, Apple TV, WhatsApp, Zoom, Slack, Fortnite, Roblox, Starbucks, Etsy oraz wiele innych.

Problemy odnotowały także instytucje finansowe (np. Venmo, Coinbase), media (Associated Press, The New York Times, The Wall Street Journal), platformy edukacyjne i projektowe (Duolingo, Canva) oraz firmy telekomunikacyjne i transportowe (Delta Air Lines, United). Nawet urządzenia IoT, takie jak dzwonki Ring i asystent Alexa, przestały działać.

AWS potwierdził pełne przywrócenie usług około godziny 13:00 czasu wschodniego USA (ET) i kontynuuje przetwarzanie zaległych komunikatów przez kolejne godziny. Firma oceniła, że awaria była stosunkowo ograniczona pod względem zasięgu i że klienci raczej nie odejdą od AWS, ponieważ ich systemy są głęboko zintegrowane z tą infrastrukturą.

Ta awaria pokazała, jak bardzo współczesne usługi internetowe i aplikacje są zależne od infrastruktury chmurowej, a także jak skomplikowane i szerokie mogą być skutki nawet pojedynczej wewnętrznej aktualizacji w takim systemie.

Ryzyko centralizacji usług

Sytuacja z AWS ukazuje ogromne ryzyko związane z centralizacją usług w jednym dostawcy i regionie chmurowym, gdzie błąd w jednym komponencie (tu API DynamoDB i problem z DNS) może zablokować dostęp do setek różnych aplikacji i usług globalnie. Z punktu widzenia ciągłości działania ta sytuacja podkreśla konieczność wdrożenia strategii wieloregionalnych lub wielochmurowych, aby ograniczyć ryzyko koncentracji i uniknąć pojedynczego punktu awarii. Firmy korzystające z chmury powinny także mieć gotowe plany awaryjne, obejmujące mechanizmy automatycznego przełączenia ruchu i redundancję danych oraz usług.

Awaria czy cyberatak? Istotny jest skutek.

Z perspektywy bezpieczeństwa ważne jest, aby pamiętać, że chociaż ta awaria nie była cyberatakiem, techniczne błędy konfiguracyjne w infrastrukturze chmurowej mogą mieć równie przykre skutki jak ataki. Wymaga to od zespołów odpowiedzialnych za bezpieczeństwo i infrastrukturę ciągłego monitorowania, automatyzacji testów i walidacji zmian oraz szybkie reagowanie na incydenty.

Ponadto, incydent uwypuklił problem zależności całych ekosystemów aplikacji od wspólnych usług bazowych, takich jak DNS czy autoryzacja. Organizacje muszą rozważyć implementację dodatkowych warstw własnych mechanizmów uwierzytelniania i mechanizmów zapasowych do kluczowych komponentów architektury.

Awaria  Amazon Web Services jest przypomnieniem, a przynajmniej powinna być, dla wszystkich organizacji korzystających z chmury, że bezpieczeństwo i ciągłość działania muszą być rozumiane i zarządzane kompleksowo, łącznie z planowaniem odporności na awarie dostawcy chmury oraz wielowarstwowym podejściem do redundancji i odtwarzania systemów krytycznych.

W świecie, gdzie infrastruktura cyfrowa stanowi kręgosłup gospodarki, kluczowe staje się:

  • zarządzanie ryzykiem koncentracji technologicznej,
  • planowanie redundancji i testowanie scenariuszy awaryjnych,
  • sprawna komunikacja kryzysowa,
  • oraz kultura uczenia się z incydentów, a nie tylko reagowania na nie.

Nie można zapobiec każdej awarii. Można jednak sprawić, by nie zatrzymała całej organizacji. Jeśli potrzebujecie wsparcia w budowaniu odporności cyfrowej, operacyjnej i strategicznej, zanim wydarzy się kolejny „czarny poniedziałek” internetu, zachęcamy do kontaktu z nami.

Zapisz się już teraz! 

Subskrybując newsletter Davidson Consulting, otrzymujesz merytoryczne analizy z zakresu zarządzania ryzykiem, ciągłości działania, cyberbezpieczeństwa i compliance (m.in. DORA, NIS2), a także informacje o naszych usługach i produktach, które pomogą Ci skutecznie wdrożyć prezentowane strategie.  

Pamiętaj, Twoja subskrypcja jest w pełni dobrowolna i możesz ją anulować w każdej chwili jednym kliknięciem.
* - Pole obowiązkowe
Dziękujemy za zapisanie się do Forum Ekspertów Odporności Operacyjnej.
Ups! Coś poszło nie tak podczas uzupełnienia formy. Spróbuj ponownie lub skontaktuj się bezpośrednio.

Najnowsze artykuły

Insider threat. Sabotaż Davisa Lu jako przykład wewnętrznego zagrożenia dla ciągłości działania

Sprawa Lu dostarcza materiału analitycznego, nad którym powinna pochylić się każda organizacja.
Czytaj dalej
Case Study

Insider threat. Sabotaż Davisa Lu jako przykład wewnętrznego zagrożenia dla ciągłości działania

Cyberbezpieczeństwo
Incydenty
insider threat, zagrożenia wewnętrzne, cyberbezpieczeństwo, sabotaż w firmie, zarządzanie ryzykiem IT, ciągłość działania, bezpieczeństwo informacji, ochrona infrastruktury, Davis Lu, Eaton Corporation, złośliwy kod, zarządzanie uprawnieniami, audyt bezpieczeństwa, Business Continuity Plan, ryzyko osobowe, incydenty bezpieczeństwa, ochrona danych, zwolnienie pracownika IT, separacja obowiązków
Podmioty ważne i kluczowe

Atak Shai Hulud 2.0.

Ujawnienie krytycznych sekretów środowiska wykonawczego!
Czytaj dalej
Case Study

Atak Shai Hulud 2.0.

Cyberbezpieczeństwo
Ciągłość działania
Bezpieczeństwo łańcucha dostaw
Incydenty
Proszę bardzo, oto lista słów kluczowych dla artykułu o ataku Shai Hulud 2.0, w formacie po przecinku: Shai Hulud 2.0, atak supply chain npm, bezpieczeństwo CI/CD, złośliwe pakiety npm, non-human identities, zarządzanie sekretami, kradzież kluczy API, ochrona środowiska wykonawczego, rotacja poświadczeń, wyciek danych GitHub, dostęp Just-in-Time, malware w potokach CI/CD, audyt bezpieczeństwa ICT, environment.json, cyberbezpieczeństwo 2025
IT i technologia

Katastrofa śmigłowca właścicieli SUP-FOL

Lekcje o sukcesji, prokurencie i ciągłości działania spółki z o.o.
Czytaj dalej
Case Study

Katastrofa śmigłowca właścicieli SUP-FOL

Ciągłość działania
Zarządzanie kryzysowe
Incydenty
katastrofa śmigłowca, wypadek lotniczy, wypadek śmigłowca pod Rzeszowem, tragedia w firmie rodzinnej, śmierć przedsiębiorców, SUP-FOL, SupFol, katastrofa śmigłowca SUP-FOL, spółka z o.o., firmy rodzinne Polska, sukcesja w firmie, sukcesja przedsiębiorstwa, sukcesja w spółce z o.o., śmierć wspólnika, śmierć członka zarządu, co po śmierci wspólnika, co po śmierci członka zarządu, paraliż decyzyjny spółki, brak zarządu w spółce, kto reprezentuje spółkę, kurator dla spółki, kurator sądowy spółki, jak powołać kuratora spółki, ile kosztuje kurator dla spółki, KRS reprezentacja, blokada konta spółki, co dzieje się ze spółką z o.o. po śmierci zarządu, co robić gdy spółka nie ma zarządu, zarządzanie ryzykiem w firmie, plan ciągłości działania, business continuity, ciągłość działania w MŚP, plan ciągłości działania w firmie, ryzyka operacyjne firm rodzinnych, ubezpieczenie key person, prokura, prokurent, prokura samoistna, prokura łączna, jak działa prokura, czy prokura wygasa po śmierci zarządu, zabezpieczenie firmy po śmierci właściciela, jak zabezpieczyć firmę po nagłej śmierci właściciela, jak przygotować sukcesję w firmie, sukcesja kapitałowa i korporacyjna, umowa spółki sukcesja, postępowanie spadkowe wspólnika, blokada rachunku firmowego, reprezentacja spółki po śmierci zarządu
Przemysł
Firmy w Polsce

Duńska "Nocna Straż"

Jak globalna polityka i nieprzewidywalność zmuszają dyplomację do innowacji i adaptacji.
Czytaj dalej
Artykuł

Duńska "Nocna Straż"

Geopolityka a biznes
Zarządzanie kryzysowe
grenlandia, usa, komunikacja kryzysowa, zarządzanie ryzykiem, dania, Dyplomacja, StosunkiMiędzynarodowe, politykaZagraniczna, Adaptacja, ZarządzanieKryzysowe
Administracja publiczna