Сертификация Uptime Institute Tier
Определением уровня надежности датацентра занимается ассоциация предприятий, собранной под флагом Uptime Institute.
Каталог TAdviser Дата-центров России и технологий для дата центров.
Содержание |
TIER Standard of Topology Uptime Institute — это отраслевой стандарт надежности и отказоустойчивости ЦОДов. Он дает заказчикам все основания для уверенности в том, что ЦОДы, прошедшие сертификацию TIER, будут функционировать определенным, вполне предсказуемым образом в аномальных условиях эксплуатации, например, после отключения электропитания
Для каждого из выделенных уровней надежности в стандарте TIA EIA 942 приводится детальное описание, требования и рекомендации к следующим системам и элементам: архитектурным решениям, электроснабжению, охлаждению, безопасности, противопожарной системе, структурированной кабельной системы, системе кабелепроводов, телекоммуникациям. Например, в стандарте приводится описание требований и рекомендаций по минимальной высоте фальшпола для определенного уровня надежности.
В стандарте при описании требования к количеству ресурсов используется буква «N» (сокращение от слова need) и простейшие математические формулы с операциями сложения и умножения. Операция сложения обозначает увеличение потребности на одну условную единицу (например, N+1 означает, что необходимо иметь запас ресурсов в одну единицу), а операция умножения увеличение потребностей в несколько раз (например, N*2 означает полное дублирование потребностей).
1-й уровень надежности ЦОД — Tier-1
Базовый уровень надежности ЦОД ((по классификации The Uptime Institute)). Этот уровень применялся для дата-центров в 60-е и 70-е годы прошлого столетия. Ошибки и отказы в работе систем и оборудования на этом уровне приводят к сбоям в работе всего ЦОД. Также работа центра обработки данных прерывается для проведения профилактических и ремонтных работ. В ЦОД может не быть фальшполов, резервных источников электроснабжения и источников бесперебойного питания (ИБП). Инженерная инфраструктура создана только для удовлетворения текущих потребностей, то есть без резервирования и избыточных ресурсов (обеспечение потребностей выражается в виде буквы «N»)
- Время простоя за год — 28,8 часов
- Коэффициент отказоустойчивости 99,671%
Сами уровни Tier начали формулироваться американским Uptime Institute еще в 1995 году, а чуть позже – Telecommunication Industry Association в Европе. Целью этих мероприятий было определение требований к центрам обработки данных, в которых будут запущены критически важные процессы. При этом исходили разработчики из чисто практических аспектов. Например, для Tier I доступность осуществляется просто за счет повышенной надежности инженерных систем. Tier II подразумевает резервирование критически важных узлов инфраструктуры. В Tier III необходимо дублировать пути получения электроэнергии и хладагента, а Tier IV требует полного резервирования всей инфраструктуры и уход от городской или федеральной электросети как основного источника энергии.Как DevOps-сервис помогает «разгрузить» высоконагруженные системы BPMSoft
Исходя из статистических расчетов и исследований, для каждого Tier был определен показатель доступности. Так, выполнение требований Tier I обеспечивает работу серверов в 99,671% времени, а Tier IV – как минимум 99,995%. Однако следует помнить, что все это – лишь статистика, и к реальной жизни она имеет такое же отношение, как наличие талона техосмотра к факту функционирования тормозной системы ABS.
2-й уровень надежности ЦОД - Tier-2
Дата-центры на второго уровня имеют небольшой уровень резервирования работоспособности систем и имеют небольшие избыточные ресурсы в инженерных системах датацентра. Но все равно подвержены перебоям из-за плановых и неплановых отказов работы оборудования в дата-центрах. Для этого уровня необходимо иметь фальшпол, резервные источники электроснабжения ЦОД. Проведение технических и ремонтных работ потребует остановку работы центра обработки данных. Система не имеет полного резервирования, однако установлены дополнительные элементы в системах охлаждения и энергоснабжения ЦОД (обеспечение потребностей выражается в виде формулы «N+1»)
- Время простоя за год — 22,0 часа
- Коэффициент отказоустойчивости 99,749%
3-й уровень надежности ЦОД — Tier-3
Даже ЦОД, построенный по всем правилам, может быть недостаточно надежным из-за неквалифицированной эксплуатации, незнания инженерами регламентов обслуживания. Потому Uptime Institute вводит понятие Operational Sustainability («эксплуатационная устойчивость»), учитывающее общие принципы организации работы команды по эксплуатации дата-центра: определение нагрузки на персонал, актуальность регламентов, определение зон ответственности в случае аварий и строгое следование инструкциям.
Дата-центр с указанным уровнем надежности позволяет провести ремонтно-профилактические работы без остановки работы ЦОД. То есть возможна одновременно эксплуатация и техническое обслуживание центра обработки данных вплоть до замены компонентов системы, добавления и удаления вышедшего из строя оборудования. Чтобы обеспечить 3-й уровень уже необходимо для системы охлаждения спроектировать и построить два трубопровода, обеспечить резервными мощностями работу всего оборудования с учетом выхода из строя или профилактики системы электроснабжения. Но ошибки в работе и отказы могут вызывать перебои в работе дата-центра. Имеет несколько путей (каналов) для распределения электропитания и охлаждения, но лишь один из них активен; имеет резервированные компоненты (обеспечение потребностей выражается в виде формулы «N+1»)
- Время простоя за год — 1,6 часа
- Коэффициент отказоустойчивости 99,982%
4-й уровень надежности датацентра — Tier - 4
Отказоустойчивый дата-центр с резервированием всех систем, позволяющий выполнить любые плановые и внеплановые работы без прерывания работы ЦОД. На этом уровне обеспечивается надежная защита от сбоев. Чтобы отвечать требованию 4-го уровня надежности необходимо дублирование всех систем с учетом того, что в каждой системе и ее «резервной копии» будет находиться, как минимум, еще один дополнительный компонент, обеспечивающий резервирование по схеме «N+1». То есть в дата-центре должно быть резервирование системы на уровне «N+1» и сама система еще должна быть, как минимум, продублирована. Отказы могут иметь место в случаях ручного аварийного отключении системы электроснабжения и срабатывания системы пожарной безопасности. На 4-м уровень даже структурированная кабельная система должна быть полностью зарезервирована.
Системы имеют двойное резервирование с учетом, как минимум, дополнительного компонента Имеет несколько активных путей распределения нагрузки и охлаждения с резервными компонентами 2 (N+1), т.е. 2 ИБП с избыточностью N+1 каждый (обеспечение потребностей выражается в виде формулы «2 (N+1)»)
- Время простоя за год — 0,4 часа
- Коэффициент отказоустойчивости 99,995%
Смотрите также
- ЦОД
- Сертификация соответствия средств связи (ССС)
- Сертификация (лицензирование) средств шифрования
- Сертификация оптоволоконной связи
- Сертификация Uptime Institute Tier