Acerca de la sustitución de nodos de clúster GitHub Enterprise Server
Puedes reemplazar un nodo funcional en un clúster GitHub Enterprise Server o puedes reemplazar un nodo que ha producido un error inesperado.
Después de reemplazar un nodo, tu instancia de GitHub Enterprise Server no distribuye automáticamente los trabajos al nuevo nodo. Puedes forzar que la instancia equilibre los trabajos entre nodos. Para obtener más información, vea «Reequilibrio de las cargas de trabajo del clúster».
Advertencia: Para evitar conflictos, no reutilices un nombre de host asignado previamente a un nodo del clúster.
Reemplazar un nodo funcional
Puedes reemplazar un nodo funcional existente en el clúster. Por ejemplo, puede que desee proporcionar a una máquina virtual (VM) recursos adicionales de CPU, memoria o almacenamiento.
Para reemplazar un nodo funcional, instala el dispositivo GitHub Enterprise Server en una nueva máquina virtual, configura una dirección IP, agrega el nuevo nodo al archivo de configuración del clúster, inicializa el clúster y aplica la configuración y, a continuación, desconecta el nodo que has reemplazado.
Nota: Si va a reemplazar el nodo principal de MySQL, consulte "Reemplazar el nodo principal de MySQL".
-
Aprovisione e instale GitHub Enterprise Server con un nombre de host único en el nodo de reemplazo.
-
Mediante el shell administrativo o DHCP, configure solo la dirección IP del nodo de reemplazo. No configures los otros parámetros.
-
Para agregar el nodo de reemplazo recién aprovisionado, en cualquier nodo,
cluster.conf
para quitar el nodo con error y agregar el de reemplazo. Por ejemplo, este archivocluster.conf
modificado reemplazaghe-data-node-3
por el nodo recién aprovisionado,ghe-replacement-data-node-3
:[cluster "ghe-replacement-data-node-3"] hostname = ghe-replacement-data-node-3 ipv4 = 192.168.0.7 # ipv6 = fd12:3456:789a:1::7 git-server = true pages-server = true mysql-server = true elasticsearch-server = true redis-server = true memcache-server = true metrics-server = true storage-server = true
Puede optar por diferir la propagación de la base de datos de un nuevo nodo de réplica de MySQL, lo que da lugar a que el dispositivo pueda abrir el dispositivo antes al tráfico. Para obtener más información, vea «Diferir la propagación de la base de datos».
-
Desde el shell administrativo del nodo con el valor
cluster.conf
modificado, ejecuteghe-cluster-config-init
. Esto iniciará el nodo recién agregado en la agrupación. -
En el mismo nodo, ejecute
ghe-cluster-config-apply
. Esto validará el archivo de configuración, lo copiará en cada nodo del clúster y configurará cada nodo según el archivocluster.conf
modificado. -
Si estás desconectando un nodo que proporciona servicios de datos, como
git-server
,pages-server
ostorage-server
, evacua el nodo. Para obtener más información, vea «Evacuación de un nodo de clúster que ejecuta servicios de datos». -
Para marcar el nodo con errores sin conexión, en cualquier nodo, modifique el archivo de configuración del clúster (
cluster.conf
) en la sección del nodo correspondiente para incluir el textooffline = true
.Por ejemplo, este valor
cluster.conf
modificado marcará el nodoghe-data-node-3
como sin conexión:[cluster "ghe-data-node-3"] hostname = ghe-data-node-3 offline = true ipv4 = 192.168.0.6 # ipv6 = fd12:3456:789a:1::6
-
Desde el shell administrativo del nodo donde ha modificado
cluster.conf
, ejecuteghe-cluster-config-apply
. Esto validará el archivo de configuración, lo copiará en cada nodo de la agrupación y marcará el nodo fuera de línea.
Reemplazar un nodo en una emergencia
Puedes reemplazar un nodo con errores en el clúster. Por ejemplo, un problema de software o hardware puede afectar a la disponibilidad de un nodo.
Nota: Si va a reemplazar el nodo principal de MySQL, consulte "Reemplazar el nodo principal de MySQL".
Para reemplazar un nodo en caso de emergencia, instala el dispositivo GitHub Enterprise Server en una nueva máquina virtual, configura una dirección IP, desconecta el nodo con errores, aplica la configuración, agrega el nuevo nodo al archivo de configuración del clúster, inicializa el clúster y aplica la configuración y, opcionalmente, evacua el nodo con errores.
-
Aprovisione e instale GitHub Enterprise Server con un nombre de host único en el nodo de reemplazo.
-
Mediante el shell administrativo o DHCP, configure solo la dirección IP del nodo de reemplazo. No configures los otros parámetros.
-
Para marcar el nodo con errores sin conexión, en cualquier nodo, modifique el archivo de configuración del clúster (
cluster.conf
) en la sección del nodo correspondiente para incluir el textooffline = true
.Por ejemplo, este valor
cluster.conf
modificado marcará el nodoghe-data-node-3
como sin conexión:[cluster "ghe-data-node-3"] hostname = ghe-data-node-3 offline = true ipv4 = 192.168.0.6 # ipv6 = fd12:3456:789a:1::6
-
Desde el shell administrativo del nodo donde ha modificado
cluster.conf
, ejecuteghe-cluster-config-apply
. Esto validará el archivo de configuración, lo copiará en cada nodo de la agrupación y marcará el nodo fuera de línea. -
Para agregar el nodo de reemplazo recién aprovisionado, en cualquier nodo,
cluster.conf
para quitar el nodo con error y agregar el de reemplazo. Por ejemplo, este archivocluster.conf
modificado reemplazaghe-data-node-3
por el nodo recién aprovisionado,ghe-replacement-data-node-3
:[cluster "ghe-replacement-data-node-3"] hostname = ghe-replacement-data-node-3 ipv4 = 192.168.0.7 # ipv6 = fd12:3456:789a:1::7 git-server = true pages-server = true mysql-server = true elasticsearch-server = true redis-server = true memcache-server = true metrics-server = true storage-server = true
Puede optar por diferir la propagación de la base de datos de un nuevo nodo de réplica de MySQL, lo que da lugar a que el dispositivo pueda abrir el dispositivo antes al tráfico. Para obtener más información, vea «Diferir la propagación de la base de datos».
-
Si va a reemplazar el nodo principal de Redis, en
cluster.conf
, modifique el valorredis-master
por el nombre del nodo de reemplazo.Nota: Si el nodo principal de Redis también es el nodo principal de MySQL, consulte "Reemplazar el nodo principal de MySQL".
Por ejemplo, en este archivo
cluster.conf
modificado se especifica un nodo de clúster recién aprovisionado,ghe-replacement-data-node-1
como nodo principal de Redis:redis-master = ghe-replacement-data-node-1
-
Desde el shell administrativo del nodo con el valor
cluster.conf
modificado, ejecuteghe-cluster-config-init
. Esto iniciará el nodo recién agregado en la agrupación. -
En el mismo nodo, ejecute
ghe-cluster-config-apply
. Esto validará el archivo de configuración, lo copiará en cada nodo del clúster y configurará cada nodo según el archivocluster.conf
modificado. -
Si estás desconectando un nodo que proporciona servicios de datos, como
git-server
,pages-server
ostorage-server
, evacua el nodo. Para obtener más información, vea «Evacuación de un nodo de clúster que ejecuta servicios de datos».
Reemplazar el nodo principal de MySQL
Para proporcionar servicios de base de datos, el clúster requiere un nodo MySQL principal y al menos un nodo MySQL secundario. Para obtener más información, vea «Acerca de los nodos de agrupación».
Si desea proporcionar la máquina virtual para el nodo principal de MySQL con más recursos, o si se produce un error en el nodo, puede reemplazar el nodo. Para minimizar el tiempo de inactividad, agregue el nuevo nodo al clúster, replique los datos de MySQL y, a continuación, promueva el nodo. Se requiere algún tiempo de inactividad durante la promoción.
-
Aprovisione e instale GitHub Enterprise Server con un nombre de host único en el nodo de reemplazo.
-
Mediante el shell administrativo o DHCP, configure solo la dirección IP del nodo de reemplazo. No configures los otros parámetros.
-
Para conectarte a tu instancia de GitHub Enterprise Server, accede mediante SSH a cualquiera de los nodos del clúster. En la estación de trabajo, ejecuta el siguiente comando. Reemplaza HOSTNAME por el nombre de host del nodo. Para obtener más información, vea «Acceder al shell administrativo (SSH)».
Shell ssh -p 122 admin@HOSTNAME
ssh -p 122 admin@HOSTNAME
-
Abra el archivo de configuración del clúster en
/data/user/common/cluster.conf
en un editor de texto. Por ejemplo, puedes utilizar Vim. Cree una copia de seguridad del archivocluster.conf
antes de editarlo.Shell sudo vim /data/user/common/cluster.conf
sudo vim /data/user/common/cluster.conf
-
En el archivo de configuración del clúster se enumera cada nodo bajo un título
[cluster "HOSTNAME"]
. Agregue un nuevo encabezado para el nodo y escriba los pares clave-valor para la configuración, reemplazando los marcadores de posición por valores reales.- Asegúrese de incluir el par clave-valor
mysql-server = true
. - La siguiente sección es un ejemplo y la configuración del nodo puede diferir.
... [cluster "HOSTNAME"] hostname = HOSTNAME ipv4 = IPV4-ADDRESS # ipv6 = IPV6-ADDRESS consul-datacenter = PRIMARY-DATACENTER datacenter = DATACENTER mysql-server = true redis-server = true ... ...
- Asegúrese de incluir el par clave-valor
-
Desde el shell administrativo del nodo con el valor
cluster.conf
modificado, ejecuteghe-cluster-config-init
. Esto iniciará el nodo recién agregado en la agrupación. -
Desde el shell administrativo del nodo donde ha modificado
cluster.conf
, ejecuteghe-cluster-config-apply
. Esto validará el archivo de configuración, lo copiará en cada nodo de la agrupación y marcará el nodo fuera de línea. -
Espere a que finalice la replicación de MySQL. Para supervisar la replicación de MySQL desde cualquier nodo del clúster, ejecute
ghe-cluster-status -v
.Poco después de agregar el nodo al clúster, es posible que vea un error para el estado de replicación mientras la replicación se actualice. La replicación puede tardar horas en función de la carga de la instancia y la última vez que la instancia generó una inicialización de base de datos.
-
Durante la ventana de mantenimiento programado, habilite el modo de mantenimiento. Para obtener más información, vea «Habilitar y programar el modo de mantenimiento».
-
Asegúrese de que la replicación de MySQL finaliza desde cualquier nodo del clúster mediante la ejecución de
ghe-cluster-status -v
.Advertencia: si no espera a que finalice la replicación de MySQL, corre el riesgo de pérdida de datos en la instancia.
-
Para establecer el nodo principal de MySQL actual en modo de solo lectura, ejecute el siguiente comando desde los nodos de la instancia.
Shell echo "SET GLOBAL super_read_only = 1;" | sudo mysql
echo "SET GLOBAL super_read_only = 1;" | sudo mysql
-
Espere hasta que los identificadores globales de transacción (GTID) establecidos en los nodos MySQL principal y secundario sean idénticos. Para comprobar los GTID, ejecute el siguiente comando desde cualquiera de los nodos de la instancia.
Shell ghe-cluster-each -r mysql -- 'echo "SELECT @@global.gtid_executed;" | sudo mysql'
ghe-cluster-each -r mysql -- 'echo "SELECT @@global.gtid_executed;" | sudo mysql'
-
Después de que los GTID de los nodos MySQL principal y secundario coincidan, actualice la configuración del clúster al abrir el archivo de configuración del clúster en
/data/user/common/cluster.conf
en un editor de texto.- Cree una copia de seguridad del archivo
cluster.conf
antes de editarlo. - En la sección de nivel superior
[cluster]
, elimine el nombre de host del nodo que ha reemplazado del par clave-valormysql-master
y, a continuación, asigne el nuevo nodo en su lugar. Si el nuevo nodo también es uno principal de Redis, ajuste el par clave-valorredis-master
.
[cluster] mysql-master = NEW-NODE-HOSTNAME redis-master = NEW-NODE-HOSTNAME primary-datacenter = primary ...
- Cree una copia de seguridad del archivo
-
Desde el shell administrativo del nodo donde ha modificado
cluster.conf
, ejecuteghe-cluster-config-apply
. Esto validará el archivo de configuración, lo copiará en cada nodo de la agrupación y marcará el nodo fuera de línea. -
Compruebe el estado de la replicación de MySQL desde cualquier nodo del clúster mediante la ejecución de
ghe-cluster-status -v
. -
Si finaliza la replicación de MySQL, desde cualquier nodo del clúster, deshabilite el modo de mantenimiento. Para obtener más información, vea «Habilitar y programar el modo de mantenimiento».