Experto revela cómo ocurrió la “mayor interrupción de TI de la historia

Tecnología

Por: Feng Li

El mundo tal como lo conocemos depende cada vez más de la conectividad digital que, en su mayor parte, funciona de manera silenciosa e invisible en segundo plano. Entonces, ¿cómo es que una sola actualización de software acabó con la mitad de Internet?

La interrupción mundial de las tecnologías de la información el 19 de julio sirve como un crudo recordatorio de nuestra vulnerabilidad a las fallas tecnológicas. Esto, provocado por una única actualización de software defectuosa proporcionada por la empresa de ciberseguridad CrowdStrike, tuvo un impacto desastroso en las aerolíneas, los medios de comunicación, los bancos y los minoristas de todo el mundo, en particular las empresas que utilizan los sistemas operativos Microsoft Windows.

Este incidente, descrito como “la mayor interrupción de TI de la historia”, nos recuerda la extensa red de interconexiones de TI que sustentan nuestra infraestructura digital y el potencial de consecuencias de gran alcance cuando algo sale mal.

Lo que comenzó con retrasos en los aeropuertos se convirtió en cancelaciones generalizadas de vuelos. La interrupción en los sistemas de las aerolíneas no solo afecta los horarios de los vuelos, sino que también afectó las cadenas de suministro globales que dependen de la carga aérea, lo que demuestra la naturaleza multifacética de los ecosistemas de TI modernos.

Mientras tanto, se interrumpieron las retransmisiones en numerosas emisoras de radio y televisión y se paralizaron las operaciones en supermercados y bancos. Los análisis preliminares sugieren que el caos se debió a una actualización del software de seguridad Falcon Sensor de CrowdStrike que se aplicó a los sistemas operativos Microsoft Windows.

Los trabajadores de empresas que utilizan CrowdStrike se encontraron con la “pantalla azul de la muerte” (una pantalla con un mensaje de error que indica una falla del sistema) cuando intentaron iniciar sesión. Además de exponer la red oculta de dependencias que sustentan nuestra sociedad y economía digitales, la interrupción también puso de relieve las dimensiones geopolíticas de estas dependencias.

Los países con fuertes vínculos con Microsoft y CrowdStrike sintieron la peor parte del impacto, pero las empresas en países como China, con sus infraestructuras de TI relativamente aisladas y controladas, parecen haberse visto menos afectadas. Con las crecientes tensiones geopolíticas en los últimos años, China y un número cada vez mayor de otros países han desarrollado activamente sus propias medidas de ciberseguridad e infraestructuras digitales, que pueden haber mitigado los efectos de este incidente.

El enfoque de China en utilizar tecnología local y reducir su dependencia de la tecnología extranjera también puede haber contribuido al menor impacto en sus sistemas. El incidente sirve como un crudo recordatorio de que las dependencias tecnológicas pueden traducirse en vulnerabilidades geopolíticas, y las autoridades estatales necesitan cada vez más considerar no sólo las implicaciones económicas sino también estratégicas y geopolíticas de sus alianzas en TI.

Recuperación e implicaciones

La forma en que los sectores afectados han manejado esta crisis refleja tanto la fortaleza como las vulnerabilidades de sus propias estrategias de seguridad y recuperación de desastres. El problema principal ha sido identificado y supuestamente rectificado. El lento proceso de recuperación que se avecina mostrará los importantes desafíos que se avecinan para restaurar la continuidad del servicio dentro de nuestros ecosistemas digitales complejos y profundamente interconectados. Es particularmente sorprendente que a pesar de numerosas lecciones pasadas, como el desastre de la migración de TI de TSB en 2018 que afectó a millones de clientes del banco del Reino Unido, no se haya implementado una implementación escalonada de software.

La ausencia de este paso, una estrategia fundamental pero crítica en la gestión de TI, expuso la fragilidad de sistemas que muchos presumían robustos. También ha planteado serias dudas sobre la resistencia tanto de los sistemas operativos Windows como de las medidas de ciberseguridad de CrowdStrike que se supone deben protegerlos.

Además, el episodio destacó los riesgos estratégicos de depender de una única fuente de tecnología. Esta interrupción global demostró lo importante que es tener diversas alianzas tecnológicas para mejorar la seguridad nacional y la estabilidad económica, al tiempo que generó preocupaciones sobre la posibilidad de que estados hostiles exploten tales vulnerabilidades.

Este incidente agregará un nuevo nivel de urgencia a las colaboraciones e intervenciones políticas internacionales en materia de ciberseguridad. A medida que los servicios comienzan a estabilizarse y reanudarse, esta interrupción debería servir como una llamada de atención tanto para los profesionales de TI, como para los líderes empresariales y los formuladores de políticas.

La necesidad apremiante de reevaluar e incluso revisar las estrategias de ciberseguridad y las prácticas de gestión de TI existentes es clara. Mejorar la resiliencia del sistema para resistir perturbaciones a gran escala debe ser una prioridad. La interrupción global de la TI marca un recordatorio oportuno y un momento crítico para los debates sobre la resiliencia digital y el futuro de la gobernanza tecnológica a nivel empresarial, de infraestructura y de políticas.

¿Y qué hay de la IA?

Otra cosa cuya respuesta aún no sabemos es la siguiente: si un solo error de software puede acabar con aerolíneas, bancos, minoristas, medios de comunicación y más en todo el mundo, ¿están nuestros sistemas preparados para la IA?

Quizás necesitemos invertir más en mejorar la confiabilidad y la metodología del software, en lugar de lanzar chatbots apresuradamente. Una industria de la IA no regulada será una receta para el desastre, especialmente en un mundo con crecientes tensiones geopolíticas. Si bien es esencial adoptar tecnologías emergentes como la IA o la cadena de bloques, también debemos entender bien los conceptos básicos.

Los operadores de ciberseguridad deben garantizar que las prácticas fundamentales de gestión y mantenimiento de TI sean sólidas y confiables, y capaces de manejar cualquier cosa, desde un ataque de ciberseguridad hasta una simple actualización de software. Las lecciones aprendidas de este incidente sin duda influirán en las estrategias futuras en el desarrollo de infraestructura de TI y la gestión de crisis.

Este artículo es una traducción de otro publicado en The Conversation. Puedes leer el texto original haciendo clic aquí.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *