Серверная комната – ключевой компонент Вашего Бизнеса

Введение в мониторинг серверные комнаты

Различные аспекты, составляющие мониторинг серверной комнаты, делают эту  тему в своем роде увлекательной. Помимо очевидных климатических проблем, есть проблемы контроля физического доступа, мониторинга инфраструктуры, которые также необходимо учесть.

Все вместе взятое, это увлекательное сочетание инструментов и методов для создания “идеальной серверной”.

Мониторинг окружающей среды в серверной комнате

Большинство людей осознают, что их серверы должны поддерживаться в пределах температурных параметров в целях достижения оптимальной производительности и уменьшения ошибок или сбоев. Но задумайтесь, в серверной комнате также содержится ценная бизнес-информация, и любая экологическая угроза может иметь катастрофические последствия для организации, которая функционирует опираясь на эти данные.

Клиенты  также хотят быть уверены, что их личные данные в безопасности и что Ваша организация  делает все возможное, чтобы добиться этого. Давайте взглянем на некоторые из наиболее важных экологических угроз, почему нужно следить за ними, и что самое главное - иметь систему раннего предупреждения.

температура

Поскольку температура является переменной средой, IT оборудование работает в очень широком диапазоне условий.  Часто технические характеристики позволяют довольно широкий диапазон температур.  Однако, следует рассматривать это не как рекомендации, а как пределы, в которых оборудование будет продолжать функционировать. Оборудование, находясь в среде какой-либо операционной крайности, будет чаще сбоить. Более разумные пределы предназначены для длительного использования.  Оптимально, серверы, маршрутизаторы и коммутаторы должны работать при температуре окружающей среды в диапазоне от 17 ° C до 27 ° C.

Серверы и другое оборудование, выделяющие много тепла из-за неисправных систем кондиционирования воздуха может превратить вашу серверную комнату в печь за  короткое время, в течение одного – двух часов.  Даже если вы попадете туда вовремя,  работающие выше нормальной температуры серверы, даже за небольшой промежуток времени получат тепловой удар, что может привести к ненадежному функционированию и возникновению неисправностей в недалеком будущем.  В Университете  Дьюка был только один кризис в серверной комнате, где температура поднялась между 30-35 ° C, но этот один случай заставил их испытать целый ряд аппаратных сбоев в течение следующих 3 месяцев.

влажность

Влажность является вторым по важности параметром. Строго говоря, мы должны говорить об относительной влажности(RH), так как влажность связана с температурой. Слишком высокое значение может привести к отказу электронных компонентов и коррозии. Ленточные устройства особенно восприимчивы, поэтому если вы используете такие устройства, необходимо держать RH на низком уровне, но не слишком низко. Слишком малая RH также является потенциальной проблемой, так как увеличивается риск электростатических угроз. Опять же ленточные устройства к этому особенно чувствительны.

Влажность воздуха может поддерживаться от 20% до 80%, но цель - получить стабильные условия с минимальными изменениями во времени.  Держите предельное изменение температуры не более чем на 5˚С в час и изменения RH менее чем 5% в час. Ни при каких обстоятельствах не должно быть конденсации.

Переохлаждение не только перерасходует энергию, но и увеличивает риск слишком быстрого изменения уровня влажности.  Это довольно распространенная проблема. Причем чем мощнее система кондиционирования, тем выше риск.

наводнение / утечки воды

Маловероятно, что ваша серверная комната пострадает от наводнения в связи с погодными условиями, но у нас есть клиенты, чьи сервера расположены в подвале, и можно только застраховать ущерб, если они установят датчики протечек. Проще для многих серверных комнат поднять полы. Предположим, кондиционер сломался и начал протекать, где вы думаете, потечет вода? Истории купания кабелей в воде не являются редкостью.

задымление

С увеличением плотности современного серверного оборудования в сочетании с большой электрической и тепловой мощностью, возникает риск местных перегревов. Мониторинг дыма имеет смысл.

воздушный поток

Поток воздуха реже вызывает беспокойство, но в любой серверной комнате высокой плотности очень важно убедиться, что холодные и горячие потоки не пересекаются. Вы же не хотите кормить теплым воздухом одно устройство от другого. Мониторинг воздушных потоков также может дать раннее предупреждение о недостаточности кондиционирования.

Физическое управление доступом

Физический доступ к серверной комнате разрешен, как правило, только уполномоченному персоналу.  Но есть много вещей, которые идут не так как мы планируем. Ограничение доступа может быть простым, как запирание дверей, но и другие методы также являются очень распространенными.

сard Reader системы

Часто применяется физический ключ, электронная клавиатура, смарт-карты и т.п.  Контроль доступа позволяет убедиться, что двери не оставляли открытыми или, что много людей входит и выходит слишком часто. Мы встречали  “температурные” проблемы, связанные с постоянным открыванием дверей в серверных комнатах.

электронные замки

Считыватели карт часто совмещают с электронными механизмами открывания двери и замками. Опять же тщательный контроль позволяет проверить, кто входит и выходит и как часто требуется доступ.

Полезна запись доступа к комнате, используя датчики движения, видеокамеры и т.д. как часть системы наблюдения.

В ночное время и в нерабочие дни системы ограничения физического доступа могут работать в составе охранной системы.

Мониторинг инфраструктуры

Многие периферийные устройства, которые подключаются к сети, могут также управляться и можно выдавать предупреждения при различных изменениях параметров. Один стандартный способ это сделать состоит в использовании Simple Network Management Protocol (SNMP). SNMP поддерживается большинством производителей оборудования.

ловушки SNMP

Представьте себе типичный сценарий, в котором задействован аккумулятор системы резервного копирования в виде источника бесперебойного питания (UPS). В случае отключения электроэнергии резервный аккумулятор включается и поддерживает работоспособность оборудования до восстановления питания или, по крайней мере, пока отключение не станет контролируемым событием. Используя SNMP можно обнаружить, что резервная батарея подключена, и это порождает SNMP Trap.  На основе этого события может быть отправлено тревожное сообщение.

Если подключенные к сети системы кондиционирования не включаются, или если блок питания критического устройства выходит из строя они тоже могут подать Trap  предупреждения.

контроль мощности

Потребление электроэнергии в центре обработки данных всегда является серьезной проблемой. Как уже было упомянуто охлаждение очень дорогостоящий процесс, цены на энергоносители постоянно растут и это предмет постоянного внимания.

Мониторинг энергопотребления также важен во многих других отношениях. Это может помочь в идентификации непроизводительных расходов, потерь  подготовке договоров с пользователями, в выявлении тяжелых и легких пользователей, в планировании будущих дополнений или изменений. В некоторых случаях это может быть полезно для учета отдельных лиц или отделов по их потреблению энергии. Все это может быть достигнуто путем тщательного контроля.

Интеллектуальные Блоки распределения питания (PDU) могут использовать отдельные розетки, генерировать статистику по квтч. и выдавать предупреждения по мере необходимости. В некоторых случаях отдельные розетки можно включать и выключать удаленно для сокращения потребления энергии.

Интеллектуальные датчики мощности могут быть установлены между устройствами и входом питания от сети для мониторинга использования, сбора статистики и оповещения.

Заключение

Серверная комната является ключевым компонентом в вашем бизнесе. Тщательный и точный мониторинг состояния окружающей среды в ней: продлит срок службы Вашего оборудования; сохранит надежность компонентов; минимизирует эксплуатационные расходы и поможет Вам избежать дорогостоящих проблем. Это позволит планировать будущие изменения и обновления и поможет вам спокойно спать ночью, уверенными в том, что в критической ситуации вы будете своевременно уведомлены, чтобы принять меры до того, как повреждение станет слишком тяжелым.

Оригинал статьи находится на сайте нашего партнера http://www.dataq.com

Примеры устройств отвечающих указанным выше требованиям: