Дерево страниц
Перейти к концу метаданных
Переход к началу метаданных

Виды сплитов системы:
Полный сплит системы - сплит, при котором все ноды одной половины кластера перестают "видеть" спаренные ноды из другой половины кластера.
Сплит определенных нод кластера - сплит, при котором только часть нод одной половины кластера перестает "видеть" спаренные ноды из другой половины кластера.
Сплит данных - сплит, при котором только данные на одной половине кластера "разошлись" с данными из другой половины кластера. При этом ноды разных частей кластера "видят" друг друга.
Сплит отличается от аварийного отключения части нод кластера тем, что при аварийном отключении аварийные ноды отключаются и не обслуживают нагрузку, которая полностью переводится на оставшиеся в работе ноды кластера, в то время как при сплите ноды считают себя активными и работоспособными, но "не видят" соседние кластера.
Основной причиной сплита системы является некорректная работа сети передачи данных между элементами кластера, а также процессов на нодах, которая приводит к тому, что нода не успевает отрабатывать кластерный обмен за заданное время. Кластер поддерживается в консистентном состоянии за счет постоянного обмена пакетами информации между элементами кластера, при этом обмен является интенсивным и должен проходить за определенное время. Если возникают проблемы с доставкой пакетов, а также в случае неспособности ноды отправить ответные сообщения в рамках кластерного обмена - происходит сплит. Ноды считают, что их соседние ноды недоступны и каждая начинает работать самостоятельно друг от друга.
Важными действиями по обеспечению надежной работы кластера является обеспечение гарантированной надежной передачи данных между нодами и обеспечение приоритета операциям по обработке пакетов синхронизации кластера.
Для этого предпринимают следующие действия:
использование стекируемых коммутаторов (дублирование) для резервирования инфраструктуры сети передачи данных;
резервирование физических подключений к сети передачи данных - 2/3/4 и более физических подключений от сервера в стек коммутаторов;
объединение нескольких Ethernet-интерфейсов в один логический Bond-интерфейс, который с использованием протокола LACP позволяет штатно отрабатывать ситуации отключения части Ethernet-каналов;
повышение приоритетов процессам, обрабатывающим трафик синхронизации кластера.

  • Нет меток