Data Science en la Industria de Defensa
Autor: Bruno Barrera Chevecich
Como sociedad moderna, estamos tan acostumbrados a la tecnología actual que la capacidad de almacenar información parece algo natural. Adoptamos como parte de nuestra cultura el almacenar información sin importar si ésta es útil actualmente o no; lo hacemos, entre otras razones, porque el costo de la tecnología que nos permite hacerlo va disminuyendo cada vez más. Eso es un punto de partida interesante para la aplicación de la ciencia de datos (data science), que es una tendencia atractiva de aplicación en el mundo privado, y por supuesto en la industria de Defensa. Hay al menos dos características interesantes que facilitan la adopción de la ciencia de datos como parte de las tecnologías de toma de decisiones: la primera es que vivimos en una sociedad en que todo lo que hacemos deja una traza digital, y no me refiero únicamente a las redes sociales: los gustos y preferencias, las tendencias políticas, las transacciones bancarias, las llamadas telefónicas, los contactos, planes de salud, hábitos de compra y pago, todo está almacenado de cierta manera. La segunda, es que los seres humanos acostumbramos a repetir patrones diarios que no varían mucho: recomendamos los mismos servicios que usamos nosotros, hacemos las mismas compras mes a mes, los mismos gastos y hábitos de ahorro. Nuestros hábitos de consumo se modifican muy poco y siempre es factible identificar la razón de esas modificaciones. Las trazas digitales generadas por nosotros son útiles para la ciencia de datos y para el aprendizaje automático (lo que conocemos como machine learning). Si aplicamos estas metodologías en el contexto del retail, por ejemplo, podremos obtener como resultado no sólo la segmentación por edad, género o ubicación geográfica, lo que ya no es una ventaja competitiva pues todas las empresas hacen eso. También podemos obtener los patrones de consumo de un conjunto de clientes. Por ejemplo, es factible hacer predicciones mucho más acertadas en términos de generar ofertas adecuadas por clientes segmentados de maneras creativas, tales como si es casado o soltero, dado si su preferencia es hacia los productos naturales. Asimismo, lo utiliza la banca y las entidades financieras para detectar patrones de fuga o fraudes bancarios, y efectuar medidas para evitar esta clase de comportamientos. En esa línea, un producto que se está desarrollando de manera experimental es el desarrollo de una herramienta de repactación asistida de crédito, que se basa en el patrón de pago y de consultas del cliente; el resultado esperado de esto es que el sistema sea capaz de efectuar recomendaciones que permitan evitar que el cliente caiga en procesos de deuda. ¿Y que hay en el mundo de Defensa? Pues bien, a diferencia de antaño, es que aparte de la fuerza física, en general las operaciones en este rubro en la actualidad se basan en una gran cantidad de análisis desde diferentes fuentes de información que son alimentadas todos los días a cada minuto y en cada segundo. En general, existe la conocida métrica que los analistas invierten el 80% de su tiempo en recolectar información y un 20% en analizarla, donde se espera lograr el cambio de paradigma por emplear sólo un 20% en la recolección de información y un 80% en las tareas de análisis. Lamentablemente en Chile no existe suficiente personal para realizar estas funciones y también una escasa especialización, por lo que en algún momento estos se pueden ver tentados a caer en la externalización de estas funciones como ocurre en otros países. Por ejemplo, en India existe una compañía que ha desarrollado sistemas de seguridad fronteriza para el BSF (Policía de Seguridad Fronteriza de India). Ellos han descubierto con la ayuda de datos históricos que cada vez que hay ganado moviéndose alrededor de la valla fronteriza, hay una gran posibilidad de intrusión transfronteriza. El movimiento del ganado aseguraba que no había minas terrestres alrededor de la cerca y que los intrusos se sentirían seguros para cruzar. Sin embargo, existe una amenaza potencial para la seguridad nacional al externalizar datos importantes de la frontera que finalmente caerán en manos de empresas para su análisis. En el caso de nuestro país, dada nuestra geografía y posición vecinal, esto resulta doblemente complejo de llevar a cabo. Los científicos de datos se enfrentan a un trabajo significativo en el diseño de sistemas de clasificación y organización de datos para mejorar la conciencia situacional en el campo, y la frustración es evidente en las mismas al encontrar que la evolución de las plataformas de recolección de datos ha mejorado significativamente sus capacidades en los últimos años, pero las interfaces gráficas de consulta no han mantenido esa evolución. Respecto a las fuerzas policiales en nuestro país están recién en un punto de partida en términos de ciencia de datos, pues a pesar de la falta de este conocimiento, y gracias a la construcción de algunos sistemas para la clasificación y referenciación geográfica del delito, obtienen conocimientos que permiten optimizar las rutas de patrullaje utilizando los recursos existentes para cubrir un área más extensa con la cantidad de recursos limitados existentes y elaborar sistemas de vigilancia en conjunto con la comunidad para aquellos lugares donde se registra una menor densidad y gravedad delictual. Sin embargo, aún se está lejos de la implementación de verdaderos y poderosos sistemas de Big Data con Data Science, que consoliden toda la información necesaria para crear soluciones efectivas que integren dispositivos aéreos de vigilancia y unidades de visión computarizada. Es muy importante la formación de este perfil, ya que no importa cuán grande sea una base de datos que la nación pueda tener sobre su seguridad nacional, pues siempre se requerirá equipos altamente capacitados para su interpretación y para producir inteligencia procesable. La ingesta de datos desde drones, plataformas de sensores y sistemas de visión computarizada es sólo la mitad de la batalla. La transferencia de inteligencia procesable a soldados y agentes de campo de manera rápida y efectiva es otro desafío a muchos niveles, desde el más básico como la información necesaria para el despliegue de unidades sobre zonas seguras y el envío de información de mantenimiento de maquinaria y armamento, pasando por la toma de decisiones basada no sólo en el poderío del armamento, sino además en su autonomía, nivel de desgaste y el conocimiento sobre el equipamiento enemigo, hasta la visión en 360 grados que ofrecen complejos sistemas de visualización tridimensional alimentados con información meteorológica, estado de las tropas, ubicación de objetivos enemigos, y situaciones de juegos de guerra en que a través de complejos algoritmos de aprendizaje automático se pretende determinar cómo lograr la mayor cantidad de objetivos militares con la menor cantidad de recursos disponibles. El desafío no es menor. Un informe de 2012 emitido por la Marina de los Estados Unidos, cita a un oficial de sus fuerzas que manifestaba que “[...] el 90% de la información solicitada ya existía en los sistemas, pero las personas que preguntaban no sabían dónde buscarla ni cómo extraerla”, pues implementar Big Data es una espada de doble filo para las tropas en el campo. El conocimiento que se puede extraer de la información puede proporcionar a las Fuerzas Armadas una ventaja crítica sobre sus oponentes, pero sin un procesamiento rápido y eficaz, la información vital puede ofuscarse bajo una secuencia de actualizaciones menos críticas. Los científicos de datos se enfrentan a un trabajo significativo en el diseño de sistemas de clasificación y organización de datos para mejorar la conciencia situacional en el campo, y la frustración es evidente en las mismas al encontrar que la evolución de las plataformas de recolección de datos ha mejorado significativamente sus capacidades en los últimos años, pero las interfaces gráficas de consulta no han mantenido esa evolución. Todo esto hace que, a pesar de que uno de los problemas más frecuentes para las Fuerzas Armadas es el establecimiento de redes de conectividad con sus agentes de campo y sus unidades, éste no representa un obstáculo tan considerable al compararse con el de presentar datos de manera rápida y comprensible en situaciones de alto estrés.