O tempo do failover dependerá do tempo necessário para promover manualmente a réplica e redirecionar o tráfego. Em média, o procedimento leva de dois a dez minutos.
Promover uma réplica não configura automaticamente a replicação para appliances existentes. Depois de promover uma réplica, se desejar, você pode configurar a replicação do novo principal para os appliances existentes e o principal anterior.
-
Se o dispositivo primário estiver disponível, para permitir que a replicação termine antes de trocar os dispositivos, no dispositivo primário, coloque o dispositivo primário em modo de manutenção.
-
Coloque o dispositivo em modo de manutenção.
-
Para usar o console de gerenciamento, consulte "Habilitar e programar o modo de manutenção";
-
Você também pode usar o comando
ghe-maintenance -s
.$ ghe-maintenance -s
-
-
Quando o número de operações ativas do Git, consultas MySQL e tarefas do Resque alcançam zero, aguarde 30 segundos.
Observação: O Nomad sempre terá trabalhos em execução, mesmo no modo de manutenção. Portanto, você pode ignorar esses trabalhos com segurança.
-
Para verificar todos os canais de replicação que reportarem
OK
, use o comandoghe-repl-status -vv
.$ ghe-repl-status -vv
-
-
No dispositivo da réplica, para parar a replicação e promover o dispositivo da réplica ao estado primário, use o comando
ghe-repl-promote
. A ação também colocará automaticamente o nó primário no nó de manutenção, se ele for acessível.$ ghe-repl-promote
-
Atualize o registro DNS para apontar para o endereço IP do appliance réplica. O tráfego é direcionado para o réplica após o término do período TTL. Se você estiver usando um balanceador de carga, verifique se ele está configurado para enviar tráfego para o réplica.
-
Avise aos usuários que eles podem voltar a trabalhar normalmente.
-
Se desejar, configure a replicação do novo primário para os appliances existentes e o primário anterior. Para obter mais informações, consulte "Sobre a configuração de alta disponibilidade".
-
Appliances para os quais você não pretende configurar replicação faziam parte da configuração de alta disponibilidade antes da falha precisam ser removidos da configuração de alta disponibilidade por UUID.
- Nos appliances anteriores, obtenha seu UUID via
cat /data/user/common/uid
.$ cat /data/user/common/uuid
- No novo primário, remova os UUIDs usando
ghe-repl-teardown
. SubstituaUUID
por um UUID que você recuperou na etapa anterior.$ ghe-repl-teardown -u UUID
- Nos appliances anteriores, obtenha seu UUID via