Awaria serwera lub NAS w firmie — pierwsze 24 godziny bez pogarszania szkody

Gdy serwer lub NAS przestaje działać, presja na „szybkie naprawienie” problemu jest ogromna. Tymczasem pierwsza doba po awarii zwykle decyduje o tym, czy odzyskanie danych będzie prostsze, czy dużo droższe i bardziej ryzykowne, dlatego najpierw trzeba zatrzymać zapisy i zabezpieczyć materiał do diagnozy.

Pierwszy krok po awarii serwera lub NAS

Odetnij użytkowników od zapisu, zatrzymaj zadania backupu i wirtualizacji, zapisz model urządzenia, liczbę dysków, komunikaty błędów i ostatnią poprawną godzinę działania. Nie inicjuj wolumenu i nie zgaduj, który dysk „na pewno” jest winny, dopóki nie masz pełnego obrazu sytuacji.

Pierwsze 2 godziny: co zabezpieczyć przed restartem, rebuildem i dalszym zapisem

  1. Zatrzymaj wszystkich użytkowników i odetnij dalsze zapisy na wolumen.
  2. Nie wykonuj aktualizacji, restartów naprawczych ani odbudowy macierzy.
  3. Zapisz komunikaty błędów, model urządzenia, liczbę dysków i aktualny stan zatok.
  4. Sprawdź, czy problem dotyczy tylko dostępu sieciowego, czy samego wolumenu i dysków.

Czego nie robić przez pierwsze 24 godziny

  • Nie inicjuj wolumenów od nowa i nie klikaj automatycznych kreatorów naprawczych.
  • Nie testuj dysków jeden po drugim w sposób, który miesza ich kolejność.
  • Nie kopiuj danych na tę samą macierz „żeby ratować co się da”.
  • Nie zakładaj, że skoro NAS się uruchomił, to dane są już bezpieczne.

Co trzeba spisać przed dalszymi działaniami

  • Producent i model NAS lub serwera.
  • Poziom RAID i liczba dysków.
  • Kolejność zatok i numery seryjne dysków.
  • Dokładna godzina awarii oraz ostatnia poprawna chwila działania.

Jak odróżnić problem logiczny od sprzętowego

Jeżeli użytkownicy widzą NAS w sieci, ale nie ma dostępu do udziałów, problem może dotyczyć systemu plików, wolumenu albo macierzy. Jeżeli urządzenie cyklicznie restartuje się, traci dyski albo pokazuje błędy SMART, rośnie ryzyko awarii sprzętowej. Te dwa scenariusze wymagają zupełnie innej ścieżki działania.

Kiedy eskalować od razu

Jeżeli NAS przechowuje księgowość, pliki projektowe, monitoring, backupy lub środowisko wirtualne, a firma traci dostęp do pracy, nie warto eksperymentować na żywym urządzeniu. Najbezpieczniejsza droga to zabezpieczenie stanu macierzy i decyzja, czy urządzenie można jeszcze bezpiecznie obrazować, czy trzeba działać poza nim.

Awaria serwera lub NAS zatrzymała pracę firmy?

W zgłoszeniu podaj model urządzenia, liczbę dysków, poziom RAID, komunikat błędu i to, czy ktoś próbował już restartu lub rebuildowania. To skraca czas wstępnej diagnozy.

Wyślij zgłoszenie 573 532 490

Checklista dla IT i zarządu przed kontaktem z laboratorium

Najwięcej czasu traci się nie na sam odzysk, ale na ustalanie, co dokładnie wydarzyło się w pierwszych minutach po awarii. Krótka checklista pomaga ocenić ryzyko i przyspiesza decyzję, czy można działać na miejscu, czy lepiej od razu odłączyć środowisko od pracy.

  • spisz model urządzenia, wersję systemu i układ dysków lub wolumenów,
  • zanotuj, czy problem dotyczy udziałów plikowych, maszyn wirtualnych, backupów czy aplikacji księgowych,
  • zachowaj screeny z alertów RAID/NAS, logów systemowych i komunikatów SMART,
  • ustal, czy po awarii wykonano restart, rebuild, re-sync, update firmware albo podmianę dysków.

Jeżeli awaria dotyczy infrastruktury produkcyjnej, zobacz też procedurę po awarii RAID w firmie i odzyskiwanie danych dla firm. To ułatwia podział działań między zespół IT i laboratorium.

Gdy w grę wchodzi VM, backup lub księgowość

Serwer lub NAS często obsługuje więcej niż jeden obszar: repozytorium kopii, maszyny VMware/Hyper-V, udział dla Optimy albo monitoring CCTV. W takich przypadkach błędna kolejność działań może uszkodzić nie jeden plik, ale całe zależności między wolumenami i snapshotami.