Некоторые замечания по технологиям виртуализации

Все мы прекрасно знаем, что Вы имеете представление о виртуализации, ее преимуществах. Пробовали или используете ее у себя.

Будем рассматривать процесс виртуализации, как оптимизацию ресурсов. С точки зрения оптимизации, чем большее количество виртуальных серверов работает на одном физическом, тем лучше. Но в погоне за экономией важно не забыть о надежности.

Мы предлагаем Вам ознакомиться с некоторыми цифрами на этот счет.

Давайте возьмем старую инфраструктуру, в которой работали 20 физических серверов и использовались 20 сервисов. В процессе оптимизации мы получили из этой инфраструктуры 2 физических сервера, на каждом из которых запущены по 10 виртуальных серверов.

Рассмотрим вероятность вот такого события: одновременно выходит из строя 10 серверов

Мы будем говорить именно о том, что сервер выходит из строя, не рассматривая другие ситуации, которые также могут приводить к сбою (питание, ошибки и прочее). Давайте сначала определимся, какова потенциально может быть вероятность выхода из строя сервера. Для простоты, представим себе гипотетическую ситуацию, где каждые полгода выходит из строя один из 20-ти серверов (может правда, может не правда, но точнее все равно мы посчитать не сможем и важны нам порядки). Итого, вероятность выхода из строя любого сервера будет равна 1/количество часов в 6-ти месяцах = 1/(6*30*24)=2*10-4.

Физическая инфраструктура - вероятность одновременного выхода из строя 10 серверов - это произведение вероятностей этих событий, т.е. 2*10-4 * 2*10-4 * …(10 раз)… * 2*10-4. Получаем вероятность равную 210*10-40. Эта вероятность примерно равна 10-37. В общем, событие маловероятное.

Виртуальная инфраструктура - для того, чтобы вышло из строя 10 серверов (в данном случае виртуальных), достаточно, чтобы отказал любой из 2-х физических серверов. Вероятность такого события 2*10-4.

Разница на 33 порядка. Скажем так, если назвать выход из строя 10 сервисов катастрофой, то в случае физической инфраструктуры катастрофа почти невозможна, а в случае виртуальной инфраструктуры - вполне вероятна.

Для локализации последствий катастрофы в VMware vSphere есть механизм обеспечения высокой доступности - High Availability. На саму вероятность события он никак не влияет, зато минимизирует простой сервисов. Так, если выйдет из строя физический сервер, то восстановление сервиса может занять несколько дней. High Availability позволяет сократить время простоя до нескольких минут. В случае выхода из строя сервера с 10 виртуальными машинами, все эти виртуальные машины будут работать уже через 2-3 минуты.

Выводы

При виртуализации инфраструктуры особое внимание нужно уделить доступности сервисов. Механизм High Availability вполне подходит для этой задачи. Важность правильной работы этого механизма сложно переоценить. Корректная настройка и тестирование High Availability - одна из приоритетных задач проекта виртуализации.

Мы видим ДВА основных пути, как правильно подойти к реализации проекта:

  1. Пройти курс обучения по технологиям VMware в любом из авторизованных учебных центров, если это не было сделано раньше;
  2. Заказать услуги по внедрению виртуализации и высокой доступности (мы можем включить эти услуги в обязательную поддержку от VMware. Увидите, стоимость проекта вырастет не сильно, зато, будут достигнуты цели проекта).

Мы не рекомендуем Вам переводить важные для бизнеса сервисы на виртуальные машины, пока не определитесь с подходом к реализации. Если цифры Вас не убедили, то представьте себе ситуацию, когда Вы, как человек ответственный за работу сервисов, оказываетесь в ситуации, когда половина инфраструктуры не работает. И благо, если это случится в пятницу вечером.


fault-chance-virtualization.txt · Последние изменения: 2013/07/18 17:28 — VMware vSphere and View blogger