El aprendizaje automático interpretable puede predecir el terrorismo a nivel mundial

Tecnología

Hace unos 20 años, una serie de ataques terroristas coordinados mató a casi 3.000 personas en el World Trade Center, Nueva York y en el Pentágono. Desde entonces, se ha llevado a cabo una gran cantidad de investigación para comprender mejor los mecanismos detrás del terrorismo con la esperanza de prevenir futuros actos de terror potencialmente devastadores. A pesar de los grandes esfuerzos invertidos para estudiar el terrorismo, la investigación cuantitativa ha desarrollado y aplicado principalmente enfoques destinados a describir casos regionales de actos terroristas sin proporcionar predicciones fiables y precisas a corto plazo a nivel local que requieren los formuladores de políticas para implementar intervenciones específicas.

Construyendo un modelo para predecir el terrorismo en todo el mundo a escalas espaciotemporales finas

Publicando en Science Advances, un equipo de investigación internacional dirigido por el Dr. Andre Python del Centro de Ciencia de Datos de la Universidad de Zhejiang investiga algoritmos de aprendizaje automático capaces de predecir y explicar a una escala espacio-temporal fina la ocurrencia de terrorismo perpetrado por actores no estatales fuera de la guerra legítima (terrorismo no estatal) en todo el mundo. Para cubrir todas las regiones del mundo potencialmente afectadas por el terrorismo durante un largo período de tiempo, los autores consideran alrededor de 21 millones de celdas semanales, que se componen de 26,551 celdas de cuadrícula a 50 km×50 km que cubren áreas habitadas en el mundo durante un período de 795 semanas entre 2002 y 2016. Un algoritmo de aprendizaje automático interpretable basado en árboles se compara con modelos predictivos de referencia alternativos para predecir y explicar la probabilidad de ocurrencia de terrorismo (respuesta) en cada celda semanal en todo el mundo. Basado en la teoría del terrorismo, el modelo incluye 20 características estructurales (variables invariantes en el tiempo que explican el efecto de, por ejemplo, el producto interno bruto (PIB) per cápita) y 14 características de procedimiento, variables dinámicas que explican el hecho de que la actividad terrorista en el pasado afecta el riesgo de terrorismo en el futuro. Para predecir fenómenos sociales complejos como el terrorismo a escalas espaciotemporales finas, es probable que los algoritmos de aprendizaje automático informados teóricamente superen a los modelos parsimoniosos utilizando solo características de procedimiento, dice el Dr. Andre Python, quien dirigió la investigación. La elección de las características incluidas en el modelo predictivo es crucial; la relevancia de los resultados del modelo y el rendimiento predictivo se benefician de una sólida comprensión conceptual de los mecanismos que impulsan el terrorismo a la escala en la que se realizan las predicciones.

¿Se puede predecir con precisión el terrorismo?

Si bien el rendimiento predictivo de los algoritmos de aprendizaje automático es relativamente alto en áreas muy afectadas por el terrorismo, sigue siendo un desafío predecir eventos que ocurren en regiones que no han experimentado el terrorismo durante un período prolongado. Los algoritmos pueden mostrar una precisión general relativamente buena incluso con una resolución espacial y temporal fina. Sin embargo, es virtualmente imposible predecir los “eventos del cisne negro”, aquellos eventos que ocurren solo una vez durante un período de tiempo muy largo, dice Python. Los eventos terroristas ocurrieron en menos del 2% de las celdas semanales consideradas en nuestro estudio global. El desequilibrio de datos reduce la precisión de los modelos, que es el número de celdas de la semana que encontraron terrorismo y que se han predicho correctamente dividido por el número total de celdas de la semana que se pronostica que encontrarán terrorismo. Esto significa que para prevenir una gran proporción de eventos terroristas en una región que no se ve muy afectada por el terrorismo, se requieren importantes recursos para inspeccionar grandes áreas donde el terrorismo potencialmente puede ocurrir.

Junto con el desacuerdo entre los académicos sobre la definición de terrorismo, la disponibilidad, la cobertura espacio-temporal y la calidad de los datos disponibles públicamente sobre el terrorismo y sus posibles impulsores siguen siendo una barrera importante para predecir con precisión el terrorismo a nivel mundial y a escalas relevantes para las políticas, dice Python. Pero los datos sobre terrorismo y los factores socioeconómicos son cada vez más detallados, completos y más accesibles. Además, el desarrollo continuo de algoritmos de aprendizaje automático interpretables es muy prometedor y hará que estas poderosas herramientas sean más accesibles para la comunidad de investigadores y los profesionales en los próximos años.

El importante papel de interpretar los resultados de los algoritmos de aprendizaje automático

Hasta hace poco, la interpretación de los modelos estaba casi esencialmente reservada a los modelos estadísticos clásicos que imponen una relación paramétrica entre las características y la respuesta como en los modelos de regresión lineal donde se supone que las características están asociadas linealmente con la respuesta, y el coeficiente asociado con cada característica puede estimarse y seguir interpretándose de acuerdo con las teorías existentes sobre terrorismo. En este estudio, los investigadores utilizaron un algoritmo de aprendizaje automático interpretable para obtener un rendimiento predictivo relativamente alto sin comprometer la interpretabilidad de los resultados.

El equipo de investigación utilizó un algoritmo de árboles potenciado por gradiente, a partir del cual calcularon las gráficas de efecto local acumulado (ALE), que resaltan la diferencia marginal en la probabilidad predicha de ocurrencia de terrorismo con un cambio incremental en la característica. Es probable que la relación entre las características y la ocurrencia del terrorismo no sea lineal y no se pueda identificar mediante modelos estadísticos estándar, dijo Python. Los gráficos ALE son una importante herramienta de interpretación. Pueden capturar estas relaciones complejas aprendidas por el algoritmo, dice Python. En nuestro estudio, evaluamos la relación entre 34 características relevantes y la ocurrencia del terrorismo en 13 regiones del mundo, agrega. Observamos que algunas relaciones de características son estables, mientras que otras son más variables entre regiones. Estos resultados nos permitieron comprender mejor las similitudes regionales y las diferencias en los efectos de los principales impulsores del terrorismo.

El algoritmo de aprendizaje automático ha capturado potencialmente relaciones complejas de los impulsores del terrorismo locales y globales a una escala que es relevante para los responsables de la formulación de políticas, dice Python. La interpretabilidad de nuestro modelo tiene importantes beneficios más allá de sus capacidades predictivas. Los resultados se pueden analizar de acuerdo con las teorías del terrorismo y, por lo tanto, pueden contribuir a generar confianza entre los modeladores y los profesionales, lo cual es un paso crucial para que estos algoritmos sean valiosos para toda la comunidad de investigación.

Fuente: Tech Xplore.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *