Падение MasterHost

От службы поддержки пришло письмо:

В ночь с 5 на 6 марта 2011 года инженерами дата-центра ?Алтуфьево? были
зафиксированы ошибки в работе системы бесперебойного питания.

Для предотвращения вреда от непрогнозируемого поведения системы
энергетического обеспечения было принято непростое решение – прекратить
подачу электроэнергии на часть оборудования дата-центра.

После обследования энергосистема вновь была запущена, но сбои в программном
обеспечении возобновились, что привело к неуправляемым событиям, повлекшим
взрыв одной из батарей системы питания.

Инженеры вновь обесточили оборудование и приступили к ремонту системы.
Потребовалось около десяти часов и помощь специально приглашенных
специалистов из сервисной службы энергоподрядчика, чтобы полностью
восстановить работоспособность источников питания, обновить их программное
обеспечение и заменить поврежденную батарею.

Суммарное время недоступности серверов составило от 10 до 13 часов.

источник

Scroll to top