Iniciar una tolerancia de fallos a tu aparato de réplica
Puedes tener tolerancia de fallos en un aparato de réplica Servidor de GitHub Enterprise por medio de la línea de comando para mantenimiento y pruebas, o si falla el aparato principal.
El tiempo requerido para la tolerancia de fallos depende de cuánto le tome para impulsar la réplica y redireccionar el tráfico de forma manual. El tiempo promedio varía entre 2 y 10 minutos.
Promoting a replica does not automatically set up replication for existing appliances. After promoting a replica, if desired, you can set up replication from the new primary to existing appliances and the previous primary.
-
Para permitir que la replicación finalice antes de cambiar aparatos, pon el aparato principal en modo mantenimiento:
- Para usar el administrador de consola, consulta "Habilitar y programar el modo mantenimiento"
-
También puedes usar el comando
ghe-maintenance -s
.$ ghe-maintenance -s
- Cuando el número de operaciones Git activas llega a cero, espera 30 segundos.
-
Para verificar que todos los canales de replicación informan
OK
, utiliza el comandoghe-repl-status -vv
.$ ghe-repl-status -vv
-
Para frenar la replicación e impulsar el aparato de réplica a un estado primario, utiliza el comando
ghe-repl-promote
. Esto también pondrá de forma automática al nodo primario en nodo mantenimiento si es accesible.$ ghe-repl-promote
- Actualiza el registro de DNS para que apunte a la dirección IP de la réplica. El tráfico es direccionado a la réplica después de que transcurra el período TTL. Si estás utilizando un balanceador de carga, asegúrate de que esté configurado para enviar el tráfico a la réplica.
- Notifica a los usuarios que pueden retomar las operaciones normales.
- Si se desea, configura una replicación desde el aparato principal nuevo al aparato existente y el principal anterior. Para obtener más información, consulta "Acerca de la configuración de alta disponibilidad."