RAID degraded/offline – czego nie robić zanim oddasz do laboratorium

RAID „Degraded”/offline – dlaczego to stan podwyższonego ryzyka

Komunikat „Degraded” oznacza, że macierz działa w trybie awaryjnym (brakuje redundancji lub jedna z kopii jest niespójna). W tym stanie jeden nieprzemyślany krok potrafi nadpisać metadane i utrudnić rekonstrukcję. Jeśli zależy Ci na danych, priorytetem jest zatrzymanie zapisów i zabezpieczenie odczytu. W przypadku macierzy i NAS najbezpieczniej jest przejść do odzyskiwania danych z macierzy RAID (bez rebuildów na ślepo).

Czego absolutnie NIE robić przed oddaniem do laboratorium

  • Nie uruchamiaj rebuild/re-sync „na próbę”.
  • Nie inicjuj ponownie macierzy i nie twórz nowych wolumenów.
  • Nie aktualizuj firmware kontrolera/NAS w trakcie incydentu.
  • Nie mieszaj kolejności dysków i nie podmieniaj ich „w ciemno”.
  • Nie uruchamiaj narzędzi naprawczych systemu plików na wolumenie (mogą zmienić strukturę na zawsze).

Co zrobić zamiast tego (bezpieczna checklista)

  • Zatrzymaj usługi zapisujące dane (VM, bazy, udziały) i wykonaj kontrolowane wyłączenie.
  • Zrób zdjęcia/printscreeny: stan macierzy, komunikaty, kolejność zatok, modele i numery seryjne.
  • Oznacz dyski (slot 1/2/3/…) i nie uruchamiaj ich osobno w systemie operacyjnym.
  • Jeśli to możliwe, przygotuj informacje o konfiguracji (RAID level, rozmiar stripe, kontroler).

Kiedy zgłosić przypadek

Jeśli macierz jest w stanie „Degraded”, pojawiają się błędy odczytu albo wolumen znika, najbezpieczniej przejść na procedurę odzyskiwania danych z macierzy RAID. W laboratorium zaczynamy od obrazowania wszystkich członków macierzy, a dopiero potem odtwarzamy układ RAID i wolumen na kopii.

Zgłoszenie: opisz komunikaty i model NAS/kontrolera — dostaniesz bezpieczny plan działania. Formularz zgłoszeniowy.