Porozmawiajmy o SLA

Niezawodność i ciągłość działania systemu informatycznego jest z punktu widzenia użytkownika biznesowego kluczowym czynnikiem, na który powinno się zwracać uwagę podczas wybierania usług IT. O jego istotności dobitnie świadczy fakt, iż poziom gwarantowanej przez dostawcę niezawodności usług określany jest zwykle w oddzielnym dokumencie – SLA, czyli Service Level Agreement. Wyjaśniamy, co powinien on zawierać i na co zwracać uwagę negocjując zapisy umowy SLA.

Na wstępie musimy przede wszystkim wyjaśnić, że sprowadzenie Service Level Agreement do umowy definiującej gwarantowany poziom dostępności usług informatycznych jest pewnym uproszczeniem. Oczywiście, ów dokument powinien precyzyjnie określać ten parametr – ogólnie jednak rzecz ujmując, opisuje on nie tylko to, jaki poziom niezawodności gwarantuje dostawca, ale również cały zestaw działań, praktyk i rozwiązań, mających stale przyczyniać się do zapewniania i zwiększania owego poziomu.

Niezawodność… i dużo więcej

Dobrze skonstruowana umowa SLA określa przede wszystkim, jakich usług świadczonych przez dostawcę dotyczy – powinny być one szczegółowe wymienione i opisane. Dokument powinien też indywidualnie (dla każdej z usług) lub zbiorczo określać wyrażony w procentach gwarantowanych poziom niezawodności. Maksymalna wartość to 100%, co oznaczałoby, iż dostawca gwarantuje, iż dostęp do jego usługi i jej funkcjonowanie nie zostaną w okresie obowiązywania umowy zakłócone nawet na chwilę. W praktyce taki zapis jest jednak absolutną rzadkością, bowiem żaden dostawca na świecie nie jest w stanie wyeliminować wszystkich czynników mogących spowodować awarię/brak dostępności – wiele z nich pozostaje bowiem poza jego kontrolą (dość wspomnieć o klęskach żywiołowych).

Umowa powinna również zawierać zapisy szczegółowo opisujące, jakie działania podejmuje dostawca w kierunku zapewnienia wysokiego poziomu niezawodności – chodzi tu np. o stałe monitorowanie dostępności wszystkich objętych umową usług (szybkie wykrycie awarii pozwala na jej sprawne usunięcie i utrzymanie wysokiego poziomu SLA), cykliczne raportowanie realizacji postanowień umowy (co dla obu stron jest skuteczną metodą oceny jakości usług), przegląd wyników oraz zestaw działań, które podejmuje lub może podejmować dostawca usług, by zwiększyć/utrzymać ich niezawodność. Dokument musi również opisywać działania, jakie podjąć musi dostawca w razie wystąpienia awarii.

Co to znaczy w praktyce?

Praktyczne aspekty realizowania postanowień umowy SLA możemy omówić na przykładzie oferty ITMation.pl – klienci firmy mogą liczyć na SLA na poziomie 99,5%. Oznacza to, że dopuszczalny czas jakichkolwiek braku dostępności do usług nie może przekroczyć 0,5% czasu obowiązywania umowy – w skali miesiąca oznacza to przestój sięgający najwyżej 3,5 godzin. Biorąc pod uwagę, że wyjątkowo rzadko może zdarzyć się aż tak długa awaria (praktyka pokazuje, że bardziej realną sytuacją jest brak jakiegokolwiek przestoju w skali miesiąca pojedynczego, znacznie krótszego problemu z dostępnością), SLA na poziomie 99,5% gwarantuje poziom niezawodności absolutnie satysfakcjonujący dla wszystkich małych i średnich firm.

Oczywiście, teoretycznie możliwe jest również uzyskanie i zagwarantowanie jeszcze wyższego poziomu niezawodność – problem jednak w tym, że śrubowanie i tak już bardzo wysokiego współczynnika SLA (np. do wartości 99,99%) oznacza ogromne koszty po stronie dostawcy (taki system musi być zbudowany w oparciu o najdroższe rozwiązania hardware’owe, wielopoziomową redundancję kluczowych urządzeń i takież zabezpieczenia), co w oczywisty sposób będzie się przekładało na wzrost ceny usług. Dlatego też SLA na poziomie 99,5% uznawane jest za idealny kompromis pomiędzy kosztami a niezawodnością. Gwoli ciekawostki dodajemy, że wiele firm decyduje się również na SLA na poziomie 99% (czyli 7h przestoju w miesiącu) – naszym zdaniem jednak de facto w najczarniejszym scenariuszu może to oznaczać stratę całego dnia roboczego przez klienta , dlatego też nasze usługi dostarczane są z SLA na poziomie 99,5%.

Czego SLA nie dotyczy?

Na końcu należy wyraźnie podkreślić, że umowa SLA określa poziom niezawodności usług świadczonych przez dostawcę – nie uwzględnia więc przestojów wynikających np. z problemów technicznych po stronie klienta (np. awarii należących do firmy komputerów), a także związanych np. z zaplanowanymi i realizowanymi na życzenie klienta zmianami w konfiguracji, zmianami w uprawnieniach użytkowników, odtwarzaniem danych z backupu (np. w celu usunięcia błędu popełnionego po stronie użytkownika), problemami klienta z dostępem do Internetu itp. Najprościej rzecz ujmując, SLA zobowiązuje dostawcę do zachowania określonego poziomu niezawodności tych elementów ekosystemu IT, za które to on bezpośrednio odpowiada i które pozostają pod jego nadzorem.

W sytuacji gdy dojdzie do takiej awarii, specjaliści dostawcy usługi są o tym informowani natychmiast (za sprawą funkcjonującego non stop systemu monitoringu, choć oczywiście w każdej chwili również klient może zgłosić problem), a awaria usuwana jest bezzwłocznie, niezależnie od pory dnia i nocy – niezależnie od tego, czy wystarczy do tego usunięcie błędu, czy również np. przywracanie danych. Oczywiście, zasady postępowania w takich sytuacjach są szczegółowe określone w umowie SLA, dlatego też każdy klient doskonale wie, jak postępować w przypadku wystąpienia jakiejś awarii.

Na koniec warto podkreślić, że każda umowa SLA określa również kary umowne za przekroczenie czasów niedostępności usług określonych w dokumencie – warto negocjować je indywidualnie z dostawcą, tak, by w razie wystąpienia awarii i wynikających z niej strat finansowych ponosił on część związanych z tych kosztów.