Cloudflare se disculpa por una interrupción importante de la red

Dado que la capacidad de recuperación de la red es un gran problema desde las órdenes de cierre de marzo, lo que lleva a los operadores a ser presionados para mantener la calidad en redes complejas y muestra cuán importantes son estas infraestructuras, se ha revelado que se produjo una interrupción de 27 minutos en la red troncal de la red La plataforma global en la nube Cloudflare el 17 de julio ha provocado una caída del 50% en el tráfico de Internet en todo el mundo.

La plataforma global en la nube Cloudflare está diseñada para ofrecer una gama de servicios de red a empresas de todos los tamaños en todo el mundo, y la compañía afirma que la plataforma hace que estos servicios sean más seguros al tiempo que mejora el rendimiento y la confiabilidad de sus propiedades críticas de Internet.

Sin embargo, se produjo una interrupción porque, mientras trabajaba en un problema no relacionado con un segmento de la red troncal desde Newark a Chicago, el equipo de ingeniería de redes de Cloudflare actualizó la configuración en un enrutador en Atlanta para aliviar la congestión.

Esta configuración contenía un error que causaba que todo el tráfico a través de la red troncal se enviara a Atlanta, lo que «abrumaba» al enrutador de Atlanta y causaba que las ubicaciones de red Cloudflare conectadas a la red troncal fallaran, según la compañía.

Debido a la arquitectura de la red troncal, esta interrupción no afectó a toda la red Cloudflare y se localizó en ciertas geografías. Los lugares afectados fueron San José, Dallas, Seattle, Los Ángeles, Chicago, Washington, DC, Richmond, Newark, Atlanta, Londres, Ámsterdam, Frankfurt, París, Estocolmo, Moscú, San Petersburgo, São Paulo, Curitiba y Porto Alegre. .

El primer problema ocurrió en el enlace troncal entre Newark y Chicago, que condujo a la congestión troncal entre Atlanta y Washington, DC. Al responder a ese problema, se realizó un cambio de configuración en Atlanta, que luego comenzó la interrupción.

Una vez que se entendió la interrupción, el enrutador de Atlanta se desactivó y el tráfico comenzó a fluir normalmente nuevamente 27 minutos más tarde. La compañía vio congestión en uno de sus centros de datos centrales que procesa registros y métricas, lo que provoca que se eliminen algunos registros. Durante este período, la red perimetral continuó funcionando normalmente.

Cloudflare dijo que su red troncal, compuesta por una serie de líneas privadas que evitan la conexión a internet pública entre sus centros de datos, permite una «mayor calidad de servicio», ya que la red privada puede usarse para evitar puntos de congestión de internet. Cloudflare agregado, con la columna vertebral, tiene un control mucho mayor sobre dónde y cómo enrutar las solicitudes de Internet y el tráfico de lo que ofrece internet público.

Cloudflare se disculpó por esta interrupción y dijo que ya ha realizado un cambio global en la configuración de la red troncal que evitará que vuelva a ocurrir.

En general, las redes en Europa y EE. UU. Se han adaptado bien a las cargas y demandas adicionales de la nueva normalidad. En un análisis de junio de 2020 de la resistencia de la red de las redes residenciales de banda ancha en las principales economías de Europa durante el cierre, la empresa de medición de la experiencia del cliente MedUX descubrió que, después de un comienzo inestable, la infraestructura de banda ancha del Reino Unido ha hecho frente a las demandas masivas desde los primeros días de encierro.

Salir de la versión móvil