Amazon.com dijo el lunes que una unidad de computación en la nube en su centro de datos en el norte de Virginia había contenido en gran medida las consecuencias de una interrupción generalizada de Internet que causó agitación global entre miles de sitios, incluidas algunas de las aplicaciones más populares de la web como Snapchat y Reddit, informó la Agencia de Noticias Reuters.
Amazon (AMZN.O) afirmó haber abordado el problema subyacente y estar cerca de una solución, pero algunos usuarios seguían quejándose de dificultades persistentes al usar servicios como la billetera digital Venmo y la plataforma de videollamadas Zoom. La interrupción dejó sin conexión a trabajadores desde Londres hasta Tokio e impidió que otros realizaran tareas cotidianas como pagar a la peluquería o cambiar sus billetes de avión.
Fue la mayor interrupción de internet desde que el fallo de CrowdStrike del año pasado paralizó los sistemas tecnológicos de hospitales, bancos y aeropuertos, poniendo de manifiesto la vulnerabilidad de las tecnologías interconectadas del mundo. Fue al menos la tercera vez en cinco años que el clúster de AWS en el norte de Virginia, conocido como US-EAST-1, contribuyó a un colapso grave de internet.

Amazon no respondió a una solicitud de mayor claridad sobre por qué ese centro de datos en particular sigue viéndose afectado, sino que se refirió a un comunicado en línea que afirmaba que el problema se había «mitigado por completo». Los problemas se originaron en el conocido como Sistema de Nombres de Dominio (DNS), que impedía que las aplicaciones encontraran la dirección correcta para la API DynamoDB de AWS, una base de datos en la nube utilizada para almacenar información de usuarios y otros datos críticos.

Después de horas de interrupciones, muchas aplicaciones volvieron a estar en línea gradualmente por la tarde en EE. UU. Pero AWS reconoció que aún había errores elevados que afectaban a varios servicios.
«Había muchos servicios internos dañados que aún se encuentran en proceso de resolución y reparación individual», se lee en un ticket de problema interno que describe la interrupción y fue revisado por Reuters.

Lambda, uno de los servicios informáticos de AWS, presentaba errores debido a problemas con un subsistema interno, según informó AWS anteriormente.
«Estamos tomando medidas para recuperar este sistema interno de Lambda», añadió.

Anteriormente, AWS dijo que la causa raíz de la interrupción fue un subsistema subyacente que monitorea la salud de sus balanceadores de carga de red utilizados para distribuir el tráfico entre varios servidores.

AWS afirmó que el problema se originó dentro de la «red interna EC2».

EC2 se refiere al servicio «Elastic Compute Cloud» de Amazon, que proporciona capacidad de nube bajo demanda dentro de AWS. Las empresas utilizan EC2 para ejecutar servidores virtuales y desarrollar, lanzar y alojar aplicaciones.

AWS había dicho más temprano ese mismo día que estaba viendo señales de recuperación en el uso de EC2 en algunos centros de datos.

AWS agregó que está tomando medidas similares en las ubicaciones restantes y espera que los problemas disminuyan, sin proporcionar un cronograma específico.

Mientras que algunas aplicaciones como Reddit (RDDT.N) y Roblox (RBLX.N) se habían estabilizado en gran medida, según el sitio web de seguimiento de interrupciones Downdetector, otros, incluido Snapchat (SNAP.N) y Duolingo (DUOL.O) estaban mostrando un resurgimiento de los problemas vistos anteriormente en el día.
Ken Birman, profesor de informática en la Universidad de Cornell, afirmó que los desarrolladores de software necesitan integrar una mayor tolerancia a fallos en su código. Explicó que AWS proporciona herramientas que los desarrolladores pueden usar para protegerse en caso de un problema en cualquiera de sus extensas redes de centros de datos, y que también pueden crear copias de seguridad con otros proveedores de la nube.
«Cuando las personas recortan costos y hacen recortes en los gastos para intentar lanzar una aplicación, y luego olvidan que se saltaron ese último paso y no se protegieron realmente contra una interrupción, esas empresas son las que realmente deberían ser examinadas más adelante», dijo Birman a Reuters.
AWS proporciona potencia informática, almacenamiento de datos y otros servicios digitales a empresas, gobiernos e individuos y es el mayor proveedor de nube del mundo, seguido por Azure, de Microsoft (MSFT.O) y Google, de Alphabet (GOOGL.O).
Las interrupciones en sus servidores pueden provocar cortes en sitios web y plataformas (desde aplicaciones de entrega de alimentos hasta plataformas de juegos y sistemas de aerolíneas) que dependen de su infraestructura en la nube.

AWS indicó en su página de estado que la interrupción del lunes se originó en su ubicación US-EAST-1, en el norte de Virginia, la más antigua y grande para servicios web. El sitio sufrió interrupciones en 2021 y 2020.
Según la documentación en el sitio web de AWS, el sitio US-EAST-1 suele ser la región predeterminada para muchos servicios de AWS.
El problema resalta cuán interconectados se han vuelto los servicios digitales cotidianos y su dependencia de un pequeño número de proveedores globales de nube, con una falla que causa estragos en los negocios y la vida cotidiana, dijeron expertos y académicos.
«Esta interrupción resalta una vez más la dependencia que tenemos de infraestructuras relativamente frágiles», dijo Jake Moore, asesor global de ciberseguridad de la firma europea de ciberseguridad ESET.
En Gran Bretaña, Lloyd Bank (LLOY.L), el Banco de Escocia y los proveedores de servicios de telecomunicaciones Vodafone (VOD.L) y BT (BT.L) fueron afectados, según el sitio web de Downdetector en el Reino Unido, al igual que el sitio web de la autoridad de impuestos, pagos y aduanas del Reino Unido, HMRC.
«La razón principal de este problema es que todas estas grandes empresas han dependido de un solo servicio», dijo Nishanth Sastry, director de investigación del Departamento de Ciencias de la Computación de la Universidad de Surrey.
Ookla, propietaria de Downdetector, dijo que más de 4 millones de usuarios reportaron problemas debido al incidente.
«Para las grandes empresas, las horas de inactividad en la nube se traducen en millones en pérdidas de productividad e ingresos», dijo Ryan Griffin, líder de prácticas cibernéticas en EE. UU. de la corredora de seguros McGill and Partners.
Wall Street se mantuvo en gran medida imperturbable y las acciones de Amazon subieron un 1,6% a 216,48 dólares.
Ookla dijo que al menos mil empresas se vieron afectadas por la interrupción.
La última vez que Snapchat registró informes en Downdetector fue más de 7.500, una cifra inferior al pico de más de 22.000, pero aún superior a las 4.000 instancias de interrupción que ocurrieron alrededor de las 7:00 a. m., hora del Este de Estados Unidos.
La startup de inteligencia artificial Perplexity y la plataforma de intercambio de criptomonedas Coinbase (COIN.O) y la aplicación de trading Robinhood (HOOD.O) experimentaron interrupciones en la plataforma y las atribuyeron a AWS.
Los propios servicios de Amazon, incluido su sitio web de compras, Prime Video y Alexa, también se vieron afectados, aunque Downdetector mostró por última vez una disminución en la gravedad.
Fortnite, propiedad de Epic Games; Clash Royale y Clash of Clans se encuentran entre las plataformas de juego afectadas. Uber (UBER.N) rival Lyft (LYFT.O) también tuvo caídas en Estados Unidos.
En una publicación en X, la presidenta de Signal, Meredith Whittaker, confirmó que la aplicación de mensajería también se vio afectada por la interrupción, aunque el multimillonario Elon Musk, propietario de X, dijo que su plataforma continuó funcionando.
Fuente: Reuters
Artículo anteriorIniciativa que promueve la innovación tecnológica en medios y redacciones recibe distinción de la SIP
Artículo siguienteVertiv y Grupo Datco establecen alianza estratégica de distribución en Argentina y Chile