четверг, 15 ноября 2012 г.

Storwize V7000. Сервисные заметки

Сервисные операции можно выполнить зайдя браузером по адресам контроллеров
https://node SA IP/service (по умолчанию адреса напоминаю - 192.168.70.121 и 122).

Зайти можно только пользователем superuser (passw0rd по умолчанию)

Так же можно зайти и через CLI. Сервисные команды из групп sainfo и satask.

Так же можно через флешку сделать некоторые вещи как то сбросить пароли, сменить сервисные адреса.

При инициализации можно включить режим Call Home. Этот режим повышает уровень поддержки или менять его. Всего 4-е уровня - локальный, Европа, США, разработчики.
По умолчанию многие не делают этого и далее все по накатанной - звонок в Москву, если там не решают - передают проблему дальше. Когда Call Home включен, то проблема передаётся на все 4-е уровня сразу и тот кто первый ответит тот и будет решать.
При включеном Call Home и необходимости поиграть и потестить и что бы не напрягать людей в поддержке, то надо включить режим сервиса:
svctask chiogrp -maintenance yes
пока этот режим включен, в поддержку ничего не отправляется.

Журнал ошибок хранится на массиве но может так же копироваться на syslog сервер удаленный. Журнал хранится пока не разрушен кластер.

Если в Events есть проблема, можно выполнить процедуру  Run Fix Procedure. Если проблему не решить в течении 25-ти часов, то у нее меняется приоритет.

Журналы событий можно скачать с массива (Settings -> Support).
Журнал аудита ведется с начала создания кластера! И ведется с записью всех команд группы svctask.

Обновление прошивки. По соглашению с ИБМ что выдается при первой инсталляции, говорится что заказчик должен поддерживать актуальное состояние прошивки.  Но будьте бдительны. При выходе новой версии прошивки, качаем Release Notes, читаем что поправили и если не критично - не обновляемся. Ждем следующую.

Если требуется обновить прошивки дисков..... Да уж... КАЖДЫЙ ДИСК ОБНОВЛЯЕТСЯ в РУЧНУЮ и ПО ОЧЕРЕДИ!

ВНИМАНИЕ, прошивка SSD всегда переводит его в OFFLINE! Обновление HDD в OnLine.

Прошивку ставим через прогон Upgrade test utility.
Обновление прошивки идет около 20 минут. Для одной ноды. Далее идет ожидание перехода томов и отработки мультипасинг-драйверов - 30 минут. И только потом обновляется вторая нода - еще 20 минут.

Во время операции обновления не работают сервисы копирования (нельзя новые запустить), те операции что были в работе - продолжают работу.

Если в кластере 4 узла (две io_group), обновление будет производиться так - первой node2 в группе 0 (20 минут), далее - node3 в группе 1 (20 минут), 10 минут пауза, далее node1 из группы 0 (20 минут) и в этот момент node2 стала Configuration Node, далее node4 группы 1 (20 минут).

Откат на предыдущую прошивку осуществляется либо автоматом при ошибке, либо в ручную. Время на откат такое же как на обновление.

  Обновление прошивки дисков:
- не должно быть алертов, снижаем нагрузку на диски.
Время на обновление диска - 15... 20 секунд.
Использовать пока только CLI.

Резервное копирование конфигурации массива.
svcconfig backup

На самом деле в 01:00 каждый день массив сам делает это.
В бэкап входит три файла. Именно они и нужны будут для восстановления если что.
Это файл xml, sh, log.




2 комментария:

it-crowd-it комментирует...

Доброго дня,
Обращаюсь так как уже незнаю куда обратиться
Имеется СХД IBM V7000 2076-112 - после аварии с электроэнергией сбились настройки канистр, при попытки сделать восстановление T3 получили ошибку:

T3 status at last time:

Preparation Status: Prepare failed
Cannot locate quorum disks


Существует возможности восстановления T4 - но опасаюсь, возможно у вас есть специалисты с опытом в данном вопросе, заранее спасибо.

Александр комментирует...

Добрый денек. Простите, но уже лет 9 я не занимался этими массивами как и остальными тоже, я сменил даже профессию с того времени и не смогу помочь к сожалению. Хотел бы но к сожалению уже и не вспомню ничего и посмотреть негде.