RAID бесполезен, спасает только резервное копирование

Can RAID save from the disaster?Друзья! Сайты MyElectrons.ru, MyElectrons.com, Cook-Light.com (и ещё кое-что), были недоступны по техническим причинам в течение почти двух недель. К сожалению, так долго мы восстанавливались из-за того, что загружен я нынче весьма плотно, а дельного помощника найти пока не удалось. Все изменения (исправления, комментарии...), что произошли на сайтах в 2016 году, утеряны безвозвратно. Примите мои искренние извинения!

Как это было:

Одной тёмной дождливой сентябрьской ночью... начался форменный кошмар: телефон раскалился от смс уведомлений от Яндекс Метрики о том, что все мои сайты недоступны. Естественно, бдительный ЯМ сообщил об этом не одной пачкой смс-ок, а зудел и будил меня на протяжении нескольких часов к ряду. Утром же обнаружилось следующее сообщение в почте:

Dear Client,

we are sending this notice to inform you that the node PM28 stopped working today at  around 18:30 CEST. First investigation shows corruption of the RAID, so far we were not able to recover anything out of it but we are working around the clock to recover data if it's possible.

If you like to start with a fresh VPS please open a ticket.

We are sorry for the inconvenience.

Мой вольный (эмоционально окрашенный, и посему не шибко близкий к оригиналу) перевод:

Дорогой клиент, спешим Вас порадовать, что один из наших дешёвых компов сдох и все ваши VPS (виртуальные серверы), что крутились на нём, отправились к праотцам. Вы можете получить девственно чистый VPS, пока мы тут круглыми часовыми напильниками чиним мёртвый RAID.

резервное копирование :)В ближайшее время буду организовывать правильно эшелонированный backup.

Восстановление заняло довольно много времени ещё и потому, что в старых дистрибутивах, что доблестный провайдер предлагает на выбор в OpenVZ, где вообще репозитории уже недоступны, а где лишь старьё на котором WordPress отказывался работать... Победил 🙂

Давайте вместе наверстывать упущенное: пишите, пожалуйста, предлагайте темы, идеи по улучшению сайта, задавайте вопросы!

- С.П.

Комментарии ВКонтакте

One thought on “RAID бесполезен, спасает только резервное копирование

  1. Вдогонку: RAID изначально расшифровывался как Redundant Array of Inexpensive Disks. И если твой взгляд, читатель, не слишком замутнён компьютерными туфтологическими аббревиатурами, то первое прочтение получается весьма сообразным: Излишний (бесполезный) Массив Дешёвых Дисков 🙂

    Подозреваю, что теоретики от компютеров сейчас начнут возмущаться в комментариях. Что-ж, буду рад живой дискуссии! В прошлом и по работе, и пытаясь создать надёжное хранилище для своих данных дома, хлебнул я печальки со всевозможными RAID’ами. И восстанавливал, и лечил их, и пересобирал, и на производительность тестировал (всевозможные варианты: 5, 1, 0, 10…). Мой личный опыт последовательно и методично разрушал иллюзию о полезности технологии: шансы на восстановление данных ничтожны (эта дрянь начинала сама что-то там чинить и убивала всё безвозвратно), производительность же была не только ниже ожидаемой, а зачастую даже хуже, чем у отдельно взятого диска (если подумать — это тоже объяснимо: дополнительные позиционирования головок, больше буферов/памяти, доп. операции в драйверах…).

    Программно реализованный RAID — беда (перегруз по I/O шинам, кэш, буфера…). Но дорогущие фирмовые железные реализации, во всяком случае те, что мне попадались — ещё хуже. Этим ведь ещё и диск подавай точно той же модели, что был тот, который вышел из строя. Резервные батарейки в RAID контроллерах в нашей лабе ни разу не спасли данные при авариях питания. А уж если железный контроллер сам ласты склеил (было и такое) — беги покупай точно такой же, ни что другое эти диски, какими бы redundant они ни были — никогда уже не прочитает.

    Сам я по доброй воле давно уже не пользую RAID, так вот догнало у провайдера. Цитатка из Википедии: «In August 2012, Dell posted an advisory against the use of RAID 5 in any configuration…».

    Так что резервное копирование нас спасёт! 🙂 Ну, иногда, если очень хочется, можно ещё с ZFS поиграться… Но толко на его надёжность полагаться тоже не стоит. Ведь всегда остаются такие единичные точки отказа, как блок питания (который может пожечь все диски в корпусе разом), кривые ручки (/# rm -rf *), пожар в конце концов!

    Ещё интересна тема с т.н. «облачными», распределёнными файловыми системами. Но пока я как-то слабо себе представляю, где бы это я смог для дома для семьи взвести резервированный CEPH (лат., читать «СЕФ») кластер 😀

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *