dostepnosc chmury sla

Kiedy przestój nie wchodzi w grę. Czy chmura jest naprawdę zawsze dostępna?  

Chmura jest najbezpieczniejszą i najpewniejszą opcją, jeśli chodzi o ciągłość prowadzenia biznesu. Poważni dostawcy gwarantują określony poziom dostępności chmury w umowie SLA, zazwyczaj na poziomie minimum 99,9 proc. Nie ma bowiem usługi niezawodnej w 100 proc. Warto więc wiedzieć, jakie obowiązki spoczywają na dostawcy i jak wygląda jego odpowiedzialność, gdy dojdzie do awarii czy innego zdarzenia zakłócającego działanie aplikacji klienta.

Kiedy firma decyduje się na przeniesienie swoich danych i aplikacji do chmury, oczekuje, że będą one dostępne, a aplikacja będzie działać przez cały czas. Przewaga chmury nad innymi rozwiązaniami w tym kontekście wynika głównie z możliwości dostępu do “nadmiarowych” zasobów na żądanie. Nie obciążają one finansów firmy, a mogą przejąć bądź zastąpić w zasadzie natychmiast problematyczne komponenty. Zamiast kupować (i utrzymywać) “zapasowe” zasoby we własnej serwerowni, można reagować na bieżąco na rosnące lub malejące natężenie ruchu. Chmura publiczna pozwala w ogóle wyłączyć (przenieść na dostawcę) własną odpowiedzialność za zdarzenia wpływające na ciągłość działania aplikacji, np. pospolite awarie dysków.  

Dostawca chmury zapewnia nieograniczone, dostępne od ręki i łatwo skalowalne zasoby. W każdej chwili (np. w razie nagłego wzrostu obciążenia aplikacji czy serwisu) można zwiększyć potrzebną moc obliczeniową. W razie awarii serwera błyskawicznie przełączyć ruch z niesprawnego serwera na działający, np. w innej lokalizacji. Dzięki temu minimalizujemy ryzyko przestoju czy unieruchomienia aplikacji, co ma szczególnie znaczenie w przypadku instytucji finansowych, publicznych czy służb szybkiego reagowania. 

Dlaczego dostępność chmury wynosi 99,99%, a nie 100%? 

Zapewnienie pełnej, 100-procentowej dostępności jest technicznie niemożliwe, bo ilość możliwych scenariuszy w złożonych środowiskach IT jest praktycznie nieskończona, więc nie sposób na każdy z nich się zabezpieczyć. W porównaniu z innymi technologiami, jak np. serwery współdzielone, chmura zapewnia jednak najwyższą nadmiarowość, wydajność i niezawodność, dzięki wspomnianej skalowalności, elastyczności i rozproszeniu geograficznemu centrów danych. W związku z tym jest w stanie – nierzadko automatycznie – pomóc nam w reakcji na różnego rodzaju zdarzenia, które mogą przydarzyć się naszej aplikacji 

Najpopularniejsi dostawcy chmurowi gwarantują dostępność swoich usług na poziomie minimum 99,9 proc. Co to oznacza w praktyce? W uproszczeniu ta liczba określa zdolność infrastruktury do realizacji wykupionej usługi na ustalonych warunkach, w normalnych okolicznościach. Czyli „uptime” (czas dostępności) na poziomie 99,9 proc. oznacza, że provider zapewnia funkcjonowanie usługi wg określonych parametrów przez 99.9 proc. czasu (najczęściej w odniesieniu do miesiąca kalendarzowego). 

Zobacz porównanie dostępności chmur AWS, Azure, GCP i Oktawave> 

Otrzymujesz więcej niż gwarantuje umowa SLA? 

Aby te zobowiązania nie miały charakteru jedynie obietnicy, poparte powinny być formalną umową, czyli SLA (ang. Service Level Agreement). Umowa ta określa gwarantowany poziom dostępności usług, jak również warunki, które musza być spełnione, aby dostawca mógł go zapewnić, mechanizmy i standardy pomiaru, czas reakcji i metody naprawy, a także konsekwencje niedotrzymania zobowiązań (jak kary umowne czy service credit, czyli środki finansowe na usługi). 

Takie formalne zobowiązanie daje klientowi pewność określonego poziomu usług. Jednak zapisane w nich wartości są niższe niż te, do których realnie dążą dostawcy. Tak więc choć providerzy gwarantują w umowach poziom minimum 99,9 proc., to w rzeczywistości dążą do osiągniecia maksymalnego poziomu 99,999 proc. (tzw. “Five 9s”, czyli pięć dziewiątek) a nawet 99,9999 proc. (1). To zaledwie 26 sekund przestoju miesięcznie. 

A co, jeśli dostępność usług spadnie poniżej gwarantowanego poziomu? Wówczas można skorzystać ze wspomnianej rekompensaty, najczęściej w postaci obniżenia rachunku za dany miesiąc. Na przykład w Oktawave gwarantujemy 100 proc. rabatu przy dostępności instancji już poniżej 99,96 proc. (dla porównania: w AWS, GCP i Azure taki upustu przysługuje poniżej 95 proc. – zobacz porównanie chmur>). Z kolei dla kontraktów indywidualnych oraz w wariancie Platinium rabat wynosi 300 proc. przy dostępności poniżej 99 proc. 

Dlaczego chmury są tak bezpieczne? 

W jaki sposób operatorzy zapewniają tak wysokie wskaźniki? Przede wszystkim dbają o utrzymywanie najwyższego poziomu redundancji i bezpieczeństwa swoich centrów danych, m.in. poprzez odpowiednią architekturę (tworzenie regionów i subregionów). Dostawcy tworzą strefy dostępności w centrach danych (ang. availability zones, czyli niezależne strefy dostępności z oddzielnym zasilaniem, łącznością itd.) i zapewniają ich rozproszenie geograficzne (czyli umiejscowione w różnych, oddalonych od siebie lokalizacjach). Dzięki temu centra danych są odporne na lokalne awarie.  

Czytaj również: Jak zapewnić bezpieczeństwo w chmurze dzięki regionom i subregionom?  

Dostawcy chmury stosują również szereg rozwiązań technologicznych, narzędzi i oprogramowania, które pozwalają automatycznie reagować na incydenty i uodpornić infrastrukturę na ewentualne błędy człowieka. Stosują też wewnętrzne kontrole i przestrzegają określonych procedur, które minimalizują ryzyko wystąpienia awarii. 

Żadne środowisko informatyczne nie da 100-procentowej pewności nieprzerwanego działania i nie chroni naszego biznesu przed awarią, cyberatakiem czy katastrofą. Spośród dostępnych rozwiązań, nie ma infrastruktury, która zapewniałaby dostępność na poziomie pięciu czy sześciu dziewiątek. Ale istnieją rozwiązania pozwalające osiągnąć 100% dostępności, m.in. dzięki zastosowaniu szeregu technologii które wykorzystują narzędzia dostępne w zasadzie wyłącznie w chmurach. 

Nie możesz pozwolić sobie na przestój? Skontaktuj się z zespołem Oktawave. Wykorzystując własną chmurę lub partnerską (AWS, Google Cloud, Azure), pomożemy Ci zbudować środowisko wysokiej dostępności, zapewniające sprawne zarządzanie ruchem i nieprzerwane działanie. 

 Warto doczytać: 

  1. Achieving “five nines” in the cloud for justice and public safety
  2. Co powinna zawierać umowa SLA? Przeczytaj przewodnik KPRM