Niedostępność w2.lvlup.pro - 22.06.2017

SystemZ | 2017-07-08 19:56:52 UTC | #1

Niedostępność w2.lvlup.pro - przebieg incydentu

Szanowni klienci, usługa działa już poprawnie.
Poniżej umieszczam wszelkie informacje odnośnie tego zdarzenia.

22.06.2017

18:39

Host w2.lvlup.pro który obsługuje wszystkie konta DirectAdmin czyli usługę Hostingu WWW przestał odpowiadać.

19:00

Po diagnozie i sprawdzeniu logów z monitoringu oraz OpenStack wynika że instancja na której znajduje się w2.lvlup.pro została wyłączona przez obsługę OVH prawdopodobnie w wyniku awarii.

19:10

Zostało utworzone zgłoszenie o niedostępności instancji public cloud obsłudze OVH.
Czekam na reakcję.

19:30

Został utworzony wątek na forum aby poinformować klientów o przebiegu awarii

19:40

Chwilowe wyłączenie możliwości zakupu nowych kont hostingu WWW.

20:00

Został wysłany mail na listę dyskusyjną OVH Cloud gdzie często bywają pracownicy techniczni OVH tak aby zwiększyć szansę na szybsze dostrzeżenie przez nich błędu lub uzyskać informację na temat czasu w którym zostanie przywrócona usługa.

W międzyczasie powstał zarys alternatywnego przywrócenia usługi z dostępnych kopii zapasowych, niestety potrwałby on prawdopodobnie wiele godzin, szukam innych rozwiązań aby zminimalizować czas niedostępności.

20:35

Wrócił ping do serwera

20:43

Instancja wróciła do życia, w2.lvlup.pro jest ponownie dostępne i większość usług wygląda na sprawną.
Trwa sprawdzanie czy podczas awarii powstały uszkodzenia.

20:55

Usługa DNS wymagała małej poprawki i restartu, działa już poprawnie.
Aplikacja do monitoringu błędnie pokazuje dalszą niedostępność serwera, lokalizuję problem.
Ostatni restart w2 miał miejsce 303 dni temu i problem pokazał się dopiero teraz.

21:02

Monitoring wykrywa serwer jako online już poprawnie.

Serwer póki co wygląda na całkowicie sprawny.
Po przerwie dla admina zostaną rozpatrzone wszelkie tickety odnośnie tego incydentu w poszukiwaniu ewentualnych błędów które mogłem przeoczyć a zauważyli je klienci.

22:05

Przywrócono możliwość zakupu nowych kont WWW.

22:28

Każda usługa dotknięta awarią otrzymała +24h ważności

22:30

Każde zgłoszenie dotyczące tego zdarzenia zostało już rozpatrzone.
Nie napotkałem na żadne dodatkowe zgłoszone usterki tak więc stwierdzam że w tym momencie usługa jest już całkowicie sprawna i wszystko wróciło do normy.

Powiązane zdarzenie:

https://forum.lvlup.pro/t/niedostepnosc-w2-lvlup-pro-26-06-2017/3089


SystemZ | 2017-06-22 17:31:47 UTC | #2


SystemZ | 2017-06-22 19:16:09 UTC | #3


SystemZ | 2017-06-22 19:16:45 UTC | #4


Flyspeak.pl | 2017-06-23 08:12:15 UTC | #5

No i to się szanuje, całe info co i jak.


SystemZ | 2017-06-23 16:42:17 UTC | #6


Timo | 2017-06-23 16:57:57 UTC | #9

Bardzo lubię taki dokładny opis, pełen profesjonalizm :)


DoreK | 2017-06-24 10:40:08 UTC | #10

Ale o problemach z n59 nigdzie nic nie było


SystemZ | 2017-07-08 19:56:58 UTC | #11