+ Reflexionando con Diego San Esteban

Diego San Esteban

Cómo la Inteligencia Artificial puede evitar problemas como el incidente Microsoft-CrowdStrike y debería convertirse en un estándar en los procesos de QA

La IA no solo mejora la calidad y la eficiencia, sino que también protege contra incidentes que pueden costar tiempo, dinero y la confianza de sus clientes.

22 julio, 2024 / 8:46 am

Esta semana la pantalla azul volvió a ser noticia, como nunca lo había sido. Recuerdo en mi época universitaria era un tema diario que nos tenía ya preparados psicológicamente, pero todo ha cambiado, en la era digital actual, los incidentes de TI pueden tener un impacto masivo y disruptivo en organizaciones y usuarios en todo el mundo.

No me voy a meter a hablar del problema, ya muchos lo han desarrollado, me voy a enfocar en la raíz del problema y en una solución que podría ser una mitigante rápida, si querido colega creo que los disaster recovery plan deberían ser revisados…,pero más allá de lo que voy a explicar, sin duda alguna, pero vamos a hablar de cómo resolver la causa raíz.

El reciente problema causado por una actualización de CrowdStrike que resultó en pantallas azules de la muerte (BSOD) y reinicios repetitivos en sistemas Windows es un claro ejemplo de esto. Sin embargo, tales problemas pueden ser prevenidos mediante la integración de la Inteligencia Artificial (IA) en los procesos de aseguramiento de la calidad (QA).

La raíz del problema

El incidente de CrowdStrike fue causado por un error lógico en un archivo de configuración que se actualizó, afectando a los sistemas que ejecutaban el sensor Falcon de CrowdStrike para Windows. Este error provocó reinicios constantes y pantallas azules, interrumpiendo operaciones críticas en diversas industrias.

Cómo la IA podría haber prevenido este incidente

Pruebas Automatizadas y Simulación de Fallos

Simulación de Escenarios: Herramientas de IA pueden simular diversos escenarios de falla, replicando condiciones extremas para identificar vulnerabilidades antes del despliegue. Esto es crucial para predecir cómo se comportarán las actualizaciones en entornos reales.

Pruebas Continuas: La IA puede ejecutar pruebas automatizadas de manera continua, evaluando el impacto de las actualizaciones en tiempo real. Esto permite detectar problemas potenciales antes de que lleguen a los usuarios finales.
Monitoreo Proactivo y Detección de Anomalías

Análisis en Tiempo Real: Algoritmos de IA pueden monitorear sistemas en tiempo real, detectando patrones anómalos que podrían indicar problemas inminentes. Esta detección temprana permite respuestas rápidas y correctivas.

Detección de Anomalías: La IA puede analizar grandes volúmenes de datos operacionales para identificar desviaciones inusuales, señalando problemas potenciales antes de que se conviertan en incidentes graves.
Validación de Configuraciones y Gestión de Actualizaciones

Validación Automática: La IA puede validar automáticamente cambios en configuraciones y actualizaciones para asegurar que no introduzcan errores lógicos. Esto incluye verificar que todas las interacciones y dependencias se gestionen correctamente.

Gestión de Actualizaciones Graduales: Utilizando IA, las actualizaciones pueden desplegarse de manera escalonada, empezando con un subconjunto pequeño de usuarios. Esto permite evaluar el impacto y corregir problemas antes de un despliegue masivo.
Automatización de la Respuesta y Recuperación

Respuesta Automática: En caso de detectar un problema, la IA puede automatizar las respuestas iniciales, como revertir cambios, aislar sistemas afectados o desplegar soluciones temporales.

Plan de Recuperación: IA puede diseñar y gestionar planes de recuperación, asegurando una restauración rápida y eficiente en caso de fallos.

Optimización del Despliegue

Despliegue Inteligente: La IA puede gestionar el despliegue de actualizaciones basado en la retroalimentación y los problemas detectados en tiempo real, ajustando el ritmo del despliegue para minimizar riesgos.
Estableciendo un Estándar en los Procesos de QA
Integrar la IA en los procesos de QA no solo previene problemas como el incidente de CrowdStrike, sino que también establece un estándar más alto de confiabilidad y eficiencia en la gestión de software. Algunas recomendaciones para implementar la IA como estándar en QA incluyen:

Adopción de Herramientas de IA para Pruebas y Monitoreo: Las organizaciones deben adoptar herramientas de IA que automatizan pruebas y monitorean sistemas en tiempo real, proporcionando una capa adicional de seguridad y prevención.

Capacitación y Cultura de Calidad: Es crucial capacitar a los equipos en el uso de IA y fomentar una cultura de calidad que priorice la detección temprana y la resolución de problemas.

Colaboración y Comunicación: Mantener una comunicación constante entre los equipos de desarrollo, operaciones y soporte, utilizando insights generados por IA para tomar decisiones informadas y rápidas.

Mi reflexión

La integración de la inteligencia artificial en los procesos de QA no solo puede prevenir problemas críticos, sino que también eleva el estándar de calidad y confiabilidad en la gestión de software. La adopción de estas tecnologías debería ser una prioridad para cualquier organización que busque minimizar riesgos y mejorar la eficiencia operativa.

Lleven estos puntos a sus próximas reuniones y hagan de la integración de la IA en los procesos de QA una prioridad estratégica. Recuerden, la prevención es la clave. La IA no solo mejora la calidad y la eficiencia, sino que también protege contra incidentes que pueden costar tiempo, dinero y la confianza de sus clientes.

Un Llamado a la Acción

1. Discutan con sus líderes de tecnología: Asegúrense de que entienden y están implementando pruebas automatizadas, simulación de fallos y monitoreo proactivo.

2. Coordinen con los líderes de riesgo: Evaluar el impacto potencial de fallos y cómo la IA puede mitigar estos riesgos es crucial.

3. Colaboren con los equipos de auditoría: La validación de configuraciones y la automatización de respuestas deben ser auditadas regularmente para garantizar su efectividad.

La reciente disrupción de CrowdStrike no solo es una lección, sino una oportunidad para mejorar. No esperen a que ocurra el próximo incidente para tomar acción. La implementación de IA en QA debe ser vista como una inversión en la estabilidad y el futuro de la empresa.

La tecnología evoluciona rápidamente, y con ella, los riesgos y desafíos. Integrar la inteligencia artificial en los procesos de QA no es simplemente una mejora técnica, sino una necesidad estratégica para cualquier empresa que desee mantenerse competitiva y resiliente.

Como líderes, es su responsabilidad asegurar que sus organizaciones estén preparadas para enfrentar cualquier desafío con las mejores herramientas y prácticas disponibles.

Lleven estos puntos clave a sus próximas reuniones, discútanlos seriamente con sus equipos, y comiencen a implementar estas prácticas hoy mismo. La resiliencia y el éxito futuro de su empresa dependen de ello.

Espero que este artículo y la reflexión final sean útiles para posicionar la importancia de la IA en los procesos de QA ante los líderes C-level de su organización. Si necesitan más detalles o un enfoque personalizado, no duden en comunicarse conmigo.

Agregue un comentario

(*) Son campos obligatorios.


Diego San Esteban

Presidente Latam Open Finance & Chief Sales Director N5

Soy un profesional pragmático, de visión estratégica, referente de la región. Mas de 30 años de experiencia transformando la industria financiera, desarrollada en más de 180 clientes, 120 de ellos, bancos y aseguradoras de la región.

Trabajando en 4 mesas de innovación de bancos centrales de la región, colaborando con 3 ministerios de desarrollo tecnológico e innovación de Centro América y Latam Norte.

Soy presidente de Latam Open Finance una organización internacional que fomenta la inclusión financiera. Director del posgrado de especialización de gestión de entidades financieras de la Universidad de Buenos Aires, una de las mejores de América. Responsable del desarrollo y estrategia comercial de N5, una empresa dedicada a la industria financiera con un crecimiento anual del 500% y nombrada por Microsoft como la startup del año 2021 para Latam & Caribe.

Vamos a reflexionar sobre los temas que afectan, impactan o modifican los comportamientos de la industria financiera, vamos a fundamentar la reflexión en datos, en comportamientos del mercado, en la realidad contextual y fundamentalmente en el sentido común, buscando romper silos de pensamiento

Reflexionar en tiempos de crisis es una necesidad, hay que detener toda acción producida por la inercia para generar valor.