Versión del artículo: Enterprise Server 2.17
Iniciar una tolerancia de fallos a tu aparato de réplica
Puedes tener tolerancia de fallos en un aparato de réplica GitHub Enterprise Server por medio de la línea de comando para mantenimiento y pruebas, o si falla el aparato principal.
El tiempo requerido para la tolerancia de fallos depende de cuánto le tome para impulsar la réplica y redireccionar el tráfico de forma manual. El tiempo promedio varía entre 2 y 10 minutos.
Promover una réplica no configura la replicación para aplicativos existentes automáticamente. Despues de promoverla, si así lo quieres, puedes configurar la replicacion desde el nuevo aplicativo principal hacia uno existente y hacia el aplicativo primario previo.
- Para permitir que la replicación finalice antes de cambiar aparatos, pon el aparato principal en modo mantenimiento:
- Para usar el administrador de consola, consulta "Habilitar y programar el modo mantenimiento"
- También puedes usar el comando
ghe-maintenance -s
.$ ghe-maintenance -s
- Cuando el número de operaciones Git activas llega a cero, espera 30 segundos.
- Para verificar que todos los canales de replicación informan
OK
, utiliza el comandoghe-repl-status -vv
.$ ghe-repl-status -vv
- Para frenar la replicación e impulsar el aparato de réplica a un estado primario, utiliza el comando
ghe-repl-promote
. Esto también pondrá de forma automática al nodo primario en nodo mantenimiento si es accesible.$ ghe-repl-promote
- Actualiza el registro de DNS para que apunte a la dirección IP de la réplica. El tráfico es direccionado a la réplica después de que transcurra el período TTL. Si estás utilizando un balanceador de carga, asegúrate de que esté configurado para enviar el tráfico a la réplica.
- Notifica a los usuarios que pueden retomar las operaciones normales.
- Si se desea, configura una replicación desde el aparato principal nuevo al aparato existente y el principal anterior. Para obtener más información, consulta "Acerca de la configuración de alta disponibilidad."