Хранение информации на HDD
Вы думаете, информация на вашем жестком диске находится в безопасности? Тогда вас ждут интересные открытия. И даже использование отказоустойчивых RAID-массивов вас может не спасти, потому что природу не обманешь.
Наиболее продвинутые товарищи уже знают, что хранить информацию на флэшках и SSD — не самая лучшая идея. В них информация хранится в виде заряда в маленьких конденсаторах, образованных в кремнии, и считывается за счет электростатического поля, наводящегося на полевой транзистор с изолированным затвором.
Это та же технология, что была у EEPROM-пзу, только с добавленной сеткой для электрического стирания блоков ячеек (EEPROM обычно стирали целиком, облучая кристалл ионизирующим излучением, например, ультрафиолетом).
Кремний, конечно, хороший изолятор — но заряд в нем всё равно понемногу стекает, и тем бодрее, чем меньше физический размер ячейки. Именно поэтому очень старая флэш-память и EEPROM (с большими ячейками) могла держать информацию по 10 лет и более, но новые микросхемы Flash так уже не могут. А применение технологии MLC (когда в одну ячейку записывается несколько бит информации за счет разного напряжения) проблему обостило еще сильнее.
Разумеется, конструкторы флэшек и SSD не идиоты — и они используют динамическую регенерацию ячеек, то есть время от времени освежают заряд в ячейках, фактически — перезаписывают их, пока они совсем не стекли. Разумеется, чтобы это работало — надо, чтобы флэшка и её контроллер находились под питанием.
Но, может быть, у классических жестких дисков ситуация лучше? Там же нет никаких зарядов — информация хранится за счет намагничивания слоя магнитного материала. В зависимости от того, в каком направлении намагничен фрагмент этого слоя — и кодируется ноль либо единица. Что с ними может произойти, если записанный диск отключить и положить в шкаф?
Так вот — произойти с HDD может самое неприятное. Но сначала немного теории, чтобы стало понятно, почему оно так.
Сейчас диски в HDD записываются методом так называемой «перпендикулярной записи», это выглядит вот так:
Используется два магнитных слоя, один из которых (нижний) «удерживающий», а второй — собственно, и несет информацию.
Проблема состоит в том, что плотность записи жестких дисков доведена уже до столь высоких значений, что физический размер записываемого «бита» сопоставим с размером минимальной структуры, удерживающей намагниченность — так называемого «магнитного домена». При этом, как известно, одноименно намагниченные области отталкиваются — и если между двумя одинаково намагниченными доменами разместить третий так же намагниченный домен — он будет стермиться самостоятельно «перевернуться» в противоположное состояние, перемагнититься от поля, наводящегося соседними доменами.
Чтобы его удержать, используют «удерживающий» слой, который намагничивается в противоположном направлении, а также избегают сочетаний трех одинаковых битов. Но и два одинаковых бита тоже норовят, из-за теплового движения молекул, постепенно менять свою ориентацию, как бы поворачиваться боком.
В общем, современные диски высокой плотности записи со временем «текут». Этот процесс стал заметен во времена, когда на один блин научились записывать более 20 гигабайт информации (примерно во времена дисков IBM серии DTLA), и дальше всё только ухудшалось.
Разумеется, конструкторы HDD не глупее консрукторов флэшек и SSD — и они используют динамическую регенерацию ячеек, то есть время от времени освежают намагниченность, фактически — перезаписывают их, пока они совсем не стекли. Разумеется, чтобы это работало — надо, чтобы диск и его контроллер (который находится в самом HDD) находились под питанием, а диски у HDD крутились.
А теперь перейдем от теории к практике. По понятным причинам, никто из производителей HDD не указывает срок гарантированного хранения информации на жестком диске в обесточенном состоянии. Потому что оглашение этих цифр многих приведет в уныние. Поэтому это можно установить только экспериментально, и постфактум — поскольку требуемый срок исчисляется годами.
Но мне это удалось. Итак, дано — небольшой сервер, в котором имелся RAID-массив (зеркало) из двух HDD — Вестерн Дигитал WD5000AAKS-00A7B0 и какого-то еще более старого серверного Seagate Barracuda, емкостью по 500 гигабайт каждый. Так получилось, что этот сервер в течении примерно двух лет никто не включал — он просто тихо стоял в уголке комнаты, ждал своего часа.
Каково же было мое удивление, когда при включении диски райд-массива даже не запустились! При этом загрузочный HDD, в качестве которого выступал какой-то гораздо более древний Samsung на 40 гигабайт, успешно заработал.
ОК, я снял диски с системы и исследовал их по отдельности. Так вот — информация на них оказалась полностью потеряна, прочитать её не представлялось никакой возможности. Причем на обоих дисках.
Сами диски я, после некоторых танцев с бубном, сумел оживить. К счастью, это были достаточно старые диски, еще не использующие «черепичную» запись (это технология, когда шаг головок меньше, чем ширина дорожки — в результате новая запись затирает часть ширины соседней дорожки) — их контроллерам удалось зацепиться за остатки намагниченности и удерживать головки на треке достаточно долго для запуска процедуры регенерации разметки. Но информация — всё, капут.
Заметьте — это были весьма старые диски, WD5000AAKS-00A7B0 это который еще с 3 блинами, 6 поверхностей (он еще даже не назывался Caviar Blue — см. на фото выше), а у Барракуды вообще как бы не 4 блина, 8 поверхностей. То есть плотность записи была не ахти. Сейчас же диски даже на терабайт уже имеют всего 1 диск, 2 поверхности — плотность записи выросла в 6 раз и более. Соответственно скорость стекания информации с обесточенных дисков должна еще вырасти.
И вот что еще интересно — оживший WD через некоторое время сам прокатал регенерацию и не демонстрирует вообще никаких проблем, работает как новый. А вот Сигейт — хотя и ожил, но как-то замедленно запускается. Очень долго инициализируется при старте. Надо будет его еще помучить заводской утилитой, отформатировать всю емкость на низком уровне и перестроить таблицу замещения секторов — может, поможет. Я подозреваю, что у него в таблице ремапов — каша, это его и сбивает с толку.
Итак, эрго — современные HDD сами по себе не годятся в качестве архивного хранилища. Их нельзя просто записать и положить на полку.
Единственный надежный способ сохранить информацию — это пресловутый файл-сервер (сейчас они называются «медиа-сервер», поскольку на них в основном хрнят видео и фото, или же «сетевое хранилище», оно же NAS — для корпоративного применения), у которого не просто пара HDD собраны в зеркало — а этот сервер еще и не выключается. Ну или по крайней мере не выключается дольше, чем на месяц. В идеале же — именно система, в которой HDD крутятся в режиме 24/365, потому что для жесткого диска лучше сутки крутиться, чем один раз стартовать. Сейчас там везде шпиндели с гидроподвесом, и головки движутся по воздуху, отжатые от диска на доли микрона воздушным потоком — так что механического износа у HDD в процессе работы фактически нет. А вот старт-стоп для них — это стресс. Как и вибрация.
Домашний микросервер: не только файлопомойка
Файл-сервер на современных SSD советовать не могу, потому что у новых SSD число циклов записи крайне ограничено, и процесс регенерации ячеек это число постепенно подъедает, даже если вы ничего на SSD не пишете.
Понимает прикол? HDD за счет регенерации дорожек под током могут жить очень долго, потому что у них число циклов перезаписи почти бесконечное. А у SSD сейчас это число очень невелико — я уже видел SSD, которые подохли при числе перезаписей менее 80. Ячейки QLC славятся низким ресурсом, да.
Выбор HDD для домашнего микросервера
Есть даже конспирологическая теория, что такое поведение носителей информации сделано специально, чтобы не дать людям хранить информацию у себя, заставить всех переносить всё ценное на облачные хранилища — где оно, естественно, будет под надежным присмотром «большого брата» из АНБ, а также братьев помельче, включая всяких уголовников и жуликов.
И кстати — дешевые медиасерверы с зеркалами HDD, по типу D-LINK DNS-320L, из продажи тоже совершенно пропали. А покупать себе какой-нибудь Synology ценой за 40 тыр без HDD — мало кто будет. И это жу-жу тоже, как говорят конспирологи, неспроста.
Не, серьезно — самое дешевое, что я сейчас нашел из хранилищ под 2 диска — это Synology DS220j за 27.369 рубликов. Сетевое хранилище NAS Zyxel NAS542-EU0101F стоит уже 35.819 рубликов — оно классное, на 4 диска, но блин цена!
Да не, не может быть. Чепуха какая-то ™ ага.
PS. Китайский huananzhi NAS 4 х 3,5 стоит 24.280 рубликов — зато фактически это маленький ПК (Pentium G3250 3.20 GHz/4 Гб ОЗУ), просто вмещающий 4 диска и со специальной ОС файлового хранилища. Но на него и винду можно накатить, если захочется.