RAID „Degraded”/offline – dlaczego to stan podwyższonego ryzyka
Komunikat „Degraded” oznacza, że macierz działa w trybie awaryjnym (brakuje redundancji lub jedna z kopii jest niespójna). W tym stanie jeden nieprzemyślany krok potrafi nadpisać metadane i utrudnić rekonstrukcję. Jeśli zależy Ci na danych, priorytetem jest zatrzymanie zapisów i zabezpieczenie odczytu. W przypadku macierzy i NAS najbezpieczniej jest przejść do odzyskiwania danych z macierzy RAID (bez rebuildów na ślepo).
Czego absolutnie NIE robić przed oddaniem do laboratorium
- Nie uruchamiaj rebuild/re-sync „na próbę”.
- Nie inicjuj ponownie macierzy i nie twórz nowych wolumenów.
- Nie aktualizuj firmware kontrolera/NAS w trakcie incydentu.
- Nie mieszaj kolejności dysków i nie podmieniaj ich „w ciemno”.
- Nie uruchamiaj narzędzi naprawczych systemu plików na wolumenie (mogą zmienić strukturę na zawsze).
Co zrobić zamiast tego (bezpieczna checklista)
- Zatrzymaj usługi zapisujące dane (VM, bazy, udziały) i wykonaj kontrolowane wyłączenie.
- Zrób zdjęcia/printscreeny: stan macierzy, komunikaty, kolejność zatok, modele i numery seryjne.
- Oznacz dyski (slot 1/2/3/…) i nie uruchamiaj ich osobno w systemie operacyjnym.
- Jeśli to możliwe, przygotuj informacje o konfiguracji (RAID level, rozmiar stripe, kontroler).
Kiedy zgłosić przypadek
Jeśli macierz jest w stanie „Degraded”, pojawiają się błędy odczytu albo wolumen znika, najbezpieczniej przejść na procedurę odzyskiwania danych z macierzy RAID. W laboratorium zaczynamy od obrazowania wszystkich członków macierzy, a dopiero potem odtwarzamy układ RAID i wolumen na kopii.
Zgłoszenie: opisz komunikaty i model NAS/kontrolera — dostaniesz bezpieczny plan działania. Formularz zgłoszeniowy.