La interrupción de AWS deja secuelas que aún afectan a miles de servicios
Una interrupción amplia en la nube de Amazon Web Services que ha comenzado hace pocos días, ha evidenciado la frágil red de interdependencias que sostiene al Internet actual, mientras que plataformas de comunicación, salud, servicios gubernamentales, educación y finanzas de todo el mundo estaban enfrentando fallas.
Con el paso de los días, AWS ha logrado diagnosticar el problema y ha empezado a trabajar en la corrección del problema, un fallo originado en la crítica región US-EAST-1. Sin embargo, el efecto en cadena ha tardado bastante en resolverse por completo.
Los especialistas han evaluado el incidente, en donde destacaron, sobre todo, la duración del apagón, que ha iniciado en horas de la madrugada. En sus actualizaciones, Amazon Web Services afirmó que para la tarde del mismo día todos los servicios regresaron a sus operaciones normales.
El origen directo del problema estuvo en las interfaces de programación de una base de datos. Según la compañía, este falló ha impactado a otros 141 servicios de AWS. Varios ingenieros de redes y especialistas en infraestructura han señalado a medios digitales que los errores son comprensibles e inevitables. Igualmente, son “hiperescalares”, como la misma AWS, Microsoft Azure y Google Cloud, debido a su complejidad y tamaño.
Sin embargo, han subrayado que esta realidad no debería eximir a los proveedores cuando su tiempo de inactividad se prolonga más de lo razonable.
Pero también subrayaron que esta realidad no debería eximir a los proveedores cuando su tiempo de inactividad se prolonga más de lo razonable. Esto se debe a que es fácil descubrir qué ha fallado, pero después, la fiabilidad global de AWS ha dejado claro lo complicado que es evitar cada falla. Ojalá esto sirva como lección y para que Amazon adopte más redundancias que impidan un desastre similar en el futuro, o al menos puedan evitar que permanezcan inactivos durante tanto tiempo.
Si cae un sistema por una vulnerabilidad crítica, la reputación cae estrepitosamente, entre otras consecuencias catastróficas. Por ello, TIC Defense apoya a las empresas con un conjunto de soluciones y herramientas de última tecnología, las cuales se adaptan a las necesidades corporativas de las organizaciones.
Un portavoz ha señalado que el gigante empresarial va a publicar uno de sus resúmenes posteriores al evento acerca de lo ocurrido. Las fallas en cascada no son algo con lo que se suele lidiar, debido a que no sufren interrupciones a menudo, y eso habla bien de los sistemas de la empresa.
Sin embargo, es fácil caer en la idea de que se debe darles margen, y tampoco olvidar que ellos mismos crean el escenario de atraer a más y más clientes a su infraestructura. Del mismo modo, los usuarios no controlan si están sobre extendiéndose o qué es lo que puede ocurrir con sus finanzas internas.
Este incidente ha tenido un habitual culpable en las caídas de la infraestructura web; los problemas de resolución del sistema de nombres de dominio. El DNS ha funcionado como una guía telefónica de Internet, en donde indica a los navegadores a qué servidor dirigirse. Por esta razón, los conflictos en DNS suelen provocar interrupciones, debido a que pueden hacer fallar solicitudes y evitar que el contenido cargue.
En estos tiempos, la computación en la nube es un logro increíble, pero en el fondo se trata de una lista interminable de complejos y dependencias que siempre se encuentran a solo una mala configuración para fallar. Esto según declaraciones de diversos directores de operaciones y especialistas en ciberseguridad.