Переход на отказоустойчивую виртуальную среду

Регистрация на видео портал

Подходы к обеспечению отказоустойчивости

VMware предусматривает широкий спектр служб и программ для повышения отказоустойчивости. Есть как службы, работающие автономно, так и службы, управляемые администраторами. В данном разделе поподробнее остановимся на пяти из них:

  • HA
  • VM Monitoring
  • FT
  • DRS
  • SRM
VMware High Availability (HA)

VMware High Availability (HA) – функция высокой доступности. Возможности VMware HA позволяют повысить отказоустойчивость виртуальной инфраструктуры и сделать непрерывным бизнес компании. Суть возможностей VMware HA заключается в перезапуске виртуальной машины отказавшего сервера VMware ESX с общего хранилища (собственно, сам VMware HA), а также рестарте зависшей виртуальной машины на сервере при потере сигнала от VMware Tools (VM Monitoring).

High Availability

Данная функция, несомненно, повышает отказоустойчивость, однако для нее существует ряд ограничений, а именно:

  • Хостов в кластере VMware HA - максимально 32 хоста;
  • Виртуальных машин на хост с числом хостов VMware ESX 8 и менее - максимально 100;
  • Виртуальных машин на хост с числом хостов VMware ESX 8 и менее для vSphere 4.0 Update 1 - максимально 160;
  • Виртуальных машин на хост с числом хостов VMware ESX 9 и более - максимально 40;

Для крупных компаний такие числа могут быть недостаточными, так что эта функция полезна для малого и среднего бизнеса, однако, стоит заметить, что компания VMware объявила о своих намерениях в ближайшем будущем эти показатели повысить. Сейчас в кластере HA может быть только 5 primary хостов ESX, чего явно недостаточно для создания катастрофоустойчивого решения на уровне possible failure domain. Кроме того, на данный момент нет прозрачного механизма назначения хостов как primary или secondary, что тоже вызывает иногда проблемы. В этом плане компания VMware уже прилагает усилия, чтобы сделать такие кластеры VMware HA, которые будут переживать неограниченное число отказов хостов VMware ESX.

Другими словами High Availability - средство отказоустойчивости виртуальных машин, позволяющее в случае отказа физического хост-сервера автоматически перезапустить его виртуальные машины с общего хранилища

См. также как построить HA кластер и расчет кластера HA.

VM Monitoring

VM Monitoring, как уже говорилось выше, - служба мгновенной перезагрузки виртуальной машины при потери тактовых импульсов от утилиты VMTools, установленной на эту ВМ. VM Monitoring довольно долго были в статусе experimental, но сегодня они уже доступны для промышленного использования. Однако VMware пока не спешит их ставить по умолчанию - неудивительно, ведь пользователи не раз сталкивались с ситуацией, когда VM Monitoring на ранних этапах своего развития давал сбой и попусту перезагружал виртуальные машины. Здесь задача VMware состоит в техническом усовершенствовании возможностей VM Monitoring, а также постепенное завоевание доверия пользователей.

VMware Fault Tolerance (FT)

VMware Fault Tolerance (FT) – средство непрерывной доступности виртуальных машин, позволяющее поддерживать резервную работающую копию виртуальной машины на другом сервере, которая мгновенно переключает на себя нагрузку в случае отказа основной машины. Она позволяет защитить виртуальные машины с помощью кластеров непрерывной доступности, позволяющих в случае отказа хоста с основной виртуальной машиной мгновенно переключиться на ее «теневую» работающую копию на другом сервере ESX. Иными словами, данная функция создает такую же ВМ, но назначенную параметром Backup VM, которая мгновенно становится Primary VM после прекращения приема пакета тактовых импульсов, отсылающихся пакетом VMTools виртуальной машины, сервером.

Fault Tolerance

Теневые ВМ должны находиться на разных машинах ESX с основной ВМ:

Fault Tolerance

У такой технологии есть как свои положительные стороны, так и отрицательные. Данная технология позволяет максимизировать отказоустойчивость отдельных ВМ, что, конечно же, обрадует заказчика. Но представьте, если создать каждой ВМ такую теневую машину. Теневая ВМ это такая же ВМ с такими же характеристиками, что и основная, только готовая в любой момент времени встать на ее место. При увеличении в два раза ВМ, также увеличатся и потребляемые ресурсы При включении данной технологии будут наложены существенные ограничения на отношения ВМ и хостов, систему хранения и сетевые параметры данной ВМ. У ВМ как Primary, так и Secondary есть несколько ограничений:

  • Только один vCPU (поддержку нескольких vCPU в Fault Tolerance обещают осенью 2014 года);
  • Не должны иметь снимков виртуальных машин (снапшотов);
  • Не могут находиться на хостах в режимах maintenance mode или standby mode;
  • Не могут иметь устройств VMDirectPath I/O;

Эксперты выделяют несколько правил, при которых технология FT будет применяться с наибольшим коэффициентом полезного действия:

  • Не запускайте более 4-8 FT-машин на одном хосте ESX (с учетом primary и secondary);
  • Поместите ISO-образы, которые используют FT-машины на общее хранилище, чтобы primary и secondary ВМ могли иметь доступ к этим данным;
  • Отключите power management в BIOS хостов ESX / ESXi. Если они войдут в power-saving mode, то может не хватить ресурсов CPU на Secondary VM на выполнение задач синхронно с первичной ВМ;
  • Равномерно распределяйте именно Primary VMs - так как именно они генерируют трафик;

На саму ВМ с включенным FT также будут наложены ограничения. Основные из них:

  • Не работает Hot-plug для виртуальных устройств, CPU и RAM;
  • Нельзя использовать Storage VMotion;
  • Не могут быть использованы VMDirectPath I/O для networking I/O devices;
  • Не могут быть использованы виртуальные USB устройства;
  • Не могут быть использованы Virtual floppy, примонтированные к физическим устройствам;
  • Нельзя использовать снапшоты;

VMware FT рекомендован к использованию к следующим ВМ:

  • ВМ с приложением с требованием постоянной доступности;
  • ВМ с высоким коэффициентом использования;
  • Приоритетно важные ВМ;

Следует отметить, что данная служба (FT) недоступна пользователям, купившим пакет Essentials и Essentials Plus

Distributed Resource Scheduler (DRS)

Distributed Resource Scheduler (DRS) – технология, выравнивающая нагрузку серверов ESX. Данная функция необходима, если в системе образуется сервер с максимальными нагрузками на нем. DRS перебрасывает ресурсы на более низко используемые серверы, таким образом, усредняя коэффициент использования всех серверов. В следующей версии VSphere Client’а 5.0 будет доступна также технология DRS for Storage.

DRS

Данная функция может быть интегрирована в систему вместе с функцией FT, что позволит добиться более высокой отказоустойчивости, однако все ограничения для FT будут суммироваться с ограничениями для DRS. Число машин на хосте должно быть не больше 4-х в целях оптимального быстродействия. Если вы попробуете мигрировать пятую виртуальную машину с включенной технологией FT на хост, вы получите вот такое сообщение: Host already has the recommended number of 4 Fault Tolerance VMs running on it Данный перенос осуществляется службой VMotion. Данная служба (DRS) также недоступна пользователям, купившим пакет Essentials и Essentials Plus

VMware Site Recovery Manager (SRM)

VMware Site Recovery Manager (SRM) – продукт автоматизирующий процессы аварийного восстановления, создания и тестирования планов восстановления после катастроф. Данный продукт предлагает передовые возможности управления аварийным восстановлением, тестирования без прерывания работы и автоматизированного аварийного переключения. VMware vCenter Site Recovery Manager поддерживает управление аварийным переключением на резервные инфраструктуры, а также между двумя инфраструктурами с активными рабочими нагрузками. Более того, возможно восстановление нескольких инфраструктур из одной общей резервной системы. Site Recovery Manager также помогает обеспечить плановое аварийное переключение ЦОД, например при их переносе.

Управление аварийным восстановлением:

  • Создание и администрирование планов восстановления непосредственно из VMware vCenter Server;
  • Обнаружение и визуализация виртуальных машин, защищенных репликацией хранилища, с помощью средств интеграции, сертифицированных поставщиками систем хранения;
  • Расширение планов восстановления с помощью пользовательских сценариев;
  • Мониторинг доступности удаленных сред и уведомление пользователей об их возможных отказах;
  • Хранение, просмотр и экспорт результатов тестирования, а также запуск аварийного переключения из VMware vCenter Server;
  • Управление доступом к планам восстановления с помощью детализированных элементов управления доступом на основе ролей;
  • Поддержка решений по репликации на основе iSCSI, FibreChannel или NFS;
  • Восстановление нескольких сред из одной общей резервной инфраструктуры;
  • Доступ к новейшим возможностям и технологиям VMware vSphere;

Тестирование без прерывания работы:

  • Средства создания снимков обеспечивают тестирование восстановления без потери реплицированных данных;
  • Подключение виртуальных машин к существующим изолированным сетям для тестирования;
  • Автоматизация тестирования плана восстановления;
  • Настройка выполнения планов восстановления для сценариев тестирования;
  • Автоматизация очистки тестовых сред после тестирования;

Автоматизированное аварийное переключение:

  • Запуск выполнения планов восстановления из VMware vCenter Server одним нажатием кнопки;
  • Автоматизация назначения реплицированных хранилищ данных для восстановления с помощью адаптеров, созданных ведущими поставщиками систем хранения для своих платформ репликации;
  • Выполнение пользовательских сценариев и приостановка процессов при восстановлении.
  • Изменение IP-адресов виртуальных машин в соответствии с конфигурацией сети резервной инфраструктуры;
  • Администрирование и мониторинг выполнения планов восстановления из VMware vCenter Server;

См. также автоматизированное средство восстановления после сбоя.

Преимущества перехода на виртуальную среду

При виртуализации есть несколько серьезных преимуществ, по сравнению с физическим аналогом построения инфраструктуры:

  • Эксплуатационная гибкость;
  • Увеличение отдачи от существующих ресурсов;
  • Софтверная поддержка;
  • Планирование;
  • Сокращение расходов;
  • Отказоустойчивость;
Эксплуатационная гибкость

С помощью виртуализации мы добьемся оперативного реагирования на изменения рынка благодаря динамическому управлению ресурсами, ускоренной инициализации серверов и улучшенного развертывания настольных компьютеров и приложений.

Увеличение отдачи от существующих ресурсов

Возможность объединения общих ресурсов инфраструктуры в пулы и уход от устаревшей модели «один сервер — одно приложение» с помощью консолидации серверов. Софтверная поддержка. В случае виртуализации ВМ используют ресурсы серверов, на которых они находятся. Но сама идея виртуализации в том, что на ВМ, например не стоят ЦПУ от компании Intel или AMD, виртуализация поддерживает серверы с разными конфигурациями, а, следовательно, на ВМ на данный момент идет большинство ОС и почти весь поддерживаемый софт этими ОС. Следовательно, на одних и тех же по характеристикам серверах, возможно, развертывать совершенно независимые друг от друга, и разные по характеристикам ВМ, также и наоборот, серверы с разными характеристиками будут поддерживать один кластер, в котором будут находиться несколько ВМ.

Планирование

С помощью удобного клиента управления всей структурой VSphere администратор сможет полностью отслеживать процессы, происходящие с серверами, а также при внедрении дальнейшего оборудования, это поможет гораздо упростить и сделать более прозрачной всю структуру виртуальных систем. Сокращение расходов. Виртуализация позволяет уменьшать число физических серверов по сравнению с числом растущих виртуальных машин, что позволит сократить расходы на оборудование, энергопотребление, а также персонал, который будет все это обслуживать.

Отказоустойчивость

При внедрении виртуализации, благодаря технологиям VMware, а именно: HA FT DRS и т.д., возможно не только сохранить свой уровень отказоустойчивости до консолидирования ВМ, но и повысить его. Ниже описаны технологии обеспечения надежности виртуальной системы, а также пути их внедрения. На ранних этапах консолидирования виртуальных технологий, будет сохранен тот же уровень надежности, но в дальнейшим при достаточно большой инфраструктуре серверного оборудования, данная инфраструктура, основанная на физическом решении, будет постепенно терять надежность с увеличением оборудования, в то время как виртуальная будет его всегда удерживать на определенном уровне.


Итак, мы рассмотрели 5 параметров, повышающих отказоустойчивость системы до максимума. Такие параметры, как HA, FT и DRS являются возможностями платформы, наличие которых будет зависеть от комплектации купленного пакета VMware. VM Monitoring присутствует во всех версиях платформ, а SRM является отдельным полноценным продуктом компании VMWare, который поставляется также с VCenter Server. Для более полного представления о том, как их совмещать и где использовать, заказчику следует предварительно проконсультироваться со специалистами, для того, чтобы они исследовали все его характеристики серверного оборудования, и дали более полную оценку консолидации виртуализации в данном проекте.

using-vmware/disaster-recovery-infrastructure.txt · Последние изменения: 2013/11/20 11:28 — VMware vSphere and View blogger