Un incidente físico provoca una caída de AWS en Oriente Medio

Cuando pensamos en el cloud, a menudo tenemos la sensación de que es una infraestructura casi "intocable". Pero la realidad es que detrás de la nube hay centros de datos físicos, con servidores, electricidad, refrigeración y conexiones de red. Y, como cualquier infraestructura real, también pueden sufrir incidentes.

Esto es exactamente lo que pasó recientemente en Amazon Web Services (AWS) en la región de Oriente Medio.

Según diversas fuentes, un incidente físico en un centro de datos provocó un incendio y una interrupción del suministro eléctrico en una de sus zonas de disponibilidad. Como consecuencia, se produjeron interrupciones y degradaciones en varios servicios cloud durante varias horas.

Impacto en servicios cloud

La incidencia afectó principalmente a la región ME-CENTRAL-1 (Emiratos Árabes Unidos) e impactó servicios muy utilizados en el ecosistema AWS, como:

  • Instancias de computación
  • Bases de datos gestionadas
  • Servicios de almacenamiento
  • Otros componentes de la infraestructura cloud

En muchos casos los clientes experimentaron errores de conexión, incrementos de latencia o indisponibilidad temporal de los servicios.

Este tipo de situaciones recuerda algo importante: el cloud no elimina los riesgos de infraestructura, simplemente los gestiona de otra forma.

La importancia de la redundancia

Incidentes como éste ponen de manifiesto la importancia de diseñar sistemas con:

  • Arquitecturas multirregión
  • Planes de recuperación ante desastres (DR)
  • Monitorización continua de la infraestructura

Muchas organizaciones que tenían despliegues redundantes en otras regiones pudieron redirigir carga o hacer failover, reduciendo así el impacto de la incidencia.

Dónde consultar el estado de los servicios de AWS

Cuando se producen problemas de este tipo, una de las primeras comprobaciones que conviene hacer es revisar el panel oficial de estado de AWS:

https://health.aws.amazon.com/health/status

En este portal AWS publica información actualizada sobre:

  • Incidencias activas o recientes
  • Servicios afectados
  • Regiones con problemas
  • Evolución de la recuperación

Para los equipos de sistemas, SOC o DevOps, este panel es muy útil para determinar rápidamente si una incidencia es interna de nuestra infraestructura o bien un problema global del proveedor cloud.

Nuestros servicios InCloud

Infordisa también dispone de su propio panel público de estado de los servicios, donde se puede consultar en tiempo real cualquier incidencia, labores de mantenimiento o el estado de las diferentes plataformas.

Esta información está disponible en: https://status.infordisa.com, y permite a los clientes conocer rápidamente si existe alguna afectación en los servicios y seguir su evolución.

En definitiva, este incidente físico vuelve a demostrar que, incluso en la nube, la resiliencia y la planificación siguen siendo claves para garantizar la continuidad del servicio.

Imagen de Infordisa
Infordisa
Departamento de Marketing

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos requeridos están marcados *

Publicar comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Otras publicaciones que te pueden interesar

Ven con nosotros a PRIMERA FILA

Nosotros tenemos esa fortuna. Vivimos la tecnología en PRIMERA FILA, somos de los primeros, y si quieres te hacemos un sitio a nuestro lado. Suscríbete a la newsletter, te compartiremos todo lo que aprendemos.