La caída que puso en jaque a medio internet
El pasado 12 de junio de 2025, Internet vivió un nuevo episodio que nos recordó lo frágil que puede llegar a ser su infraestructura, por muy descentralizada que parezca. Cloudflare, una de las empresas más importantes en servicios de red, protección DDoS y distribución de contenido, sufrió una interrupción global de más de dos horas y media, afectando a millones de usuarios y a servicios de todo tipo.
La interrupción comenzó a las 10:45 PDT y paralizó prácticamente todos los productos de Cloudflare: desde Workers, Access y Gateway hasta servicios más visibles como Stream, Images y el mismísimo panel de administración. Nada se salvó. Fue una caída masiva que dejó sin aire a buena parte del ecosistema digital. Y, aunque no fue la única empresa afectada, la magnitud de su alcance la convirtió en el epicentro del desastre.
¿Qué fue lo que falló exactamente?
El problema se originó en uno de los servicios internos más críticos de Cloudflare: Workers Key Value (KV), una base de datos distribuida fundamental para la configuración, autenticación y entrega de contenido en sus servicios. Este servicio, a su vez, depende parcialmente de un proveedor externo de nube. ¿Cuál? Nada más y nada menos que Google Cloud.
Lo que ocurrió fue un fallo en la infraestructura de almacenamiento de Google Cloud, que afectó directamente la disponibilidad del servicio KV. En otras palabras: Cloudflare cayó porque un componente esencial de su sistema alojado en Google Cloud dejó de funcionar correctamente. Esto desencadenó un efecto dominó que terminó por apagar prácticamente todo.
Cloudflare asumió su parte de responsabilidad, reconociendo que, aunque el fallo se originó en un tercero, la decisión de depender de él fue suya. Y razón no les falta: si tu arquitectura se sostiene sobre una única pieza externa y esa pieza se rompe, el diseño mismo es el problema.
La paradoja de depender entre gigantes
Aquí es donde la historia se vuelve aún más irónica. Cloudflare, que da servicio a una gran parte de Internet, depende de Google Cloud para una pieza clave de su infraestructura. Y a su vez, muy probablemente, Google Cloud utiliza servicios de Cloudflare. Es un bucle de interdependencia donde si uno falla, el otro también puede caer. Estamos en un ecosistema donde gigantes tecnológicos están entrelazados de tal forma que una interrupción en uno puede escalar como un terremoto digital.
La caída, además, reabrió el debate sobre la concentración de poder tecnológico en pocas manos. Si empresas tan grandes como Google Cloud o AWS sufren fallos, el daño colateral es inmediato y global. Y lo más grave: puede afectar incluso a quienes no son sus clientes directos.
Un puntero nulo: el pequeño culpable del gran desastre
Según las investigaciones preliminares, el error que provocó la caída podría haber sido un simple puntero nulo en Google Cloud. Un cambio en las políticas de cuotas habría insertado datos con campos en blanco, lo que provocó una excepción en los procesos binarios, generando bucles infinitos que paralizaron sistemas críticos en múltiples regiones al mismo tiempo.
Este tipo de fallos, aunque parecen pequeños, tienen un impacto descomunal cuando escalan a nivel de infraestructura global. Es la prueba de que, en un entorno cada vez más automatizado y gobernado por inteligencia artificial, un solo error lógico puede echar abajo decenas de servicios esenciales.
Consecuencias visibles e invisibles
Durante las dos horas y veintiocho minutos que duró la interrupción, miles de servicios se vieron afectados, desde plataformas de vídeo hasta herramientas empresariales y sistemas de autenticación. Aunque no hubo pérdida de datos ni incidentes de seguridad, el coste reputacional y operativo fue significativo.
Los productos de Cloudflare están diseñados para no depender de un único punto de fallo. Sin embargo, en este caso, el sistema demostró lo contrario: la dependencia de un almacén de datos central en Google Cloud fue suficiente para que toda la arquitectura colapsara. Y eso, tratándose de una empresa que habla mucho de resiliencia y redundancia, deja una lección muy clara.
Fuente: Blog de Cloudflare