Реплицируемое хранилище для VMware vSphere на Red Hat Gluster

Мы уже привыкли к кластерам высокой доступности, где в случае отказа физического сервера, виртуальные машины продолжают работать, перераспределившись между оставшимися серверами. Такое решение основано на использовании общего хранилища. Конечно же, элементы хранилища должны быть дублированы.

Представим на минуту, что у нас два здания или более. И в каждом здании центр обработки данных или просто сервера и системы хранения данных. Вполне логично расширить кластер таким образом, чтобы он охватывал несколько зданий. Но тогда встает задача синхронизации хранилищ данных. Эту задачу можно решать, например, с помощью репликации, vSphere Replication (входящая в vSphere, начиная с Essentials Plus) или Veeam Backup & Replication. Раз в 15 минут при этом виртуальная машина будет реплицирована на другое хранилище. Fault Tolerance ограничивает нас 4-мя vCPU, но это беспрецедентный уровень защиты виртуальной машины. Другой вариант - сразу получить синхронизируемое хранилище. Т.е. данные на хранилище в одном здании будут точной копией данных во втором здании в любой момент времени. Такое распределенное хранилище и позволяет организовать Gluster от Red Hat.

Gluster (или GlusterFS) - это распределенная файловая система, по возможностям не уступающая Amazon S3 или Google File System, но адаптированная для использования в коммерческих компаниях и государственных учреждениях различного масштаба. Адаптированность заключается в возможности получить поддержку от Red Hat, что гарантирует решение любых проблем, возникших в процессе эксплуатации, в кратчайшие сроки. Gluster работает поверх основной операционной системы и поддерживает различные типы распределения данных в зависимости от того, какое соотношение производительности и объема данных мы хотим получить.

Datastore для VMware vSphere

На схеме показаны два здания, соединенных между собой каналом с пропускной способностью не менее 1Gbit. В каждом здании присутствуют узлы ESXi, на которых работаю виртуальные машины (VM). В целом схема классическая за исключением прослойки Gluster Datastore.

Для его организации условно взяты 4 сервера с внутренними дисками. Объем датастора для VMware будет определен в зависимости от типа распределения контента.

На схеме выше мы проиллюстрировали принцип работы GlusterFS. Сервера, названные условно A1, A2, B1 и B2 содержат определенное количество дисков. Файлы данных делятся на блоки. Каждый блок, в данном случае, хранится на двух серверах. Обращение может происходить к блоку, находящемуся на любом из серверов - они равноправны. Запись также происходит на любой сервер. После записи блоки синхронизируются. В данном случае Gluster создан как распределенный реплицируемый (distributed replicated).

Типы томов Gluster

В зависимости от поставленной задачи мы можем сконфигурировать один из трех видов Gluster:

  • Распределенный реплицируемый (distributed replicated) - это как раз случай, когда нужно получить отказоустойчивое линейно масштабируемое распределенное хранилище. В этом случае данные реплицируются (зеркалируются) по двум или более узлам Gluster. При построении распределенного реплицируемого Gluster можно указать количество реплик. Увеличение количество реплик повышает отказоустойчивость, но снижает доступный объем дискового пространства.
  • Распределенный (distributed) - GlusterFS в его чистом виде. Плохо приспособлен для реальных задач, поскольку выход из строя даже одного диска может привести к серьезной потере данных, поскольку блоки распределяются по дискам случайно.
  • Распределенный разделенный (distributed stripped) - подходит для работы с большими и очень большими файлами. Файл делится на определенное количество частей (stipe count) при блоки распределены по серверам таким образом, что доступ к частям файла может происходить параллельно.
vmware-vsphere-datastore-on-glusterfs.txt · Последние изменения: 2015/05/21 17:47 — VMware vSphere and View blogger