Europa invierte mil millones en drones autónomos pero no sabe cómo garantizar que no se equivoquen: un investigador argentino en Madrid propone un enfoque arquitectónico para abordar el problema

En julio de 2026, los líderes de los países miembros de la OTAN se reunirán en Ankara. Según información confirmada por Bloomberg el 5 de marzo de 2026 a partir de fuentes de la alianza, el foco de la cumbre no estará en los presupuestos de defensa sino en algo más específico: cómo dirigir las inversiones hacia drones y sistemas habilitados por inteligencia artificial. Es, en los términos de la propia alianza, el reconocimiento de que la automatización militar ya forma parte de las prioridades estratégicas actuales y que Europa necesita ponerse al día.

El problema es que la OTAN sabe lo que quiere pero no tiene resuelto cómo hacerlo de forma segura.

Lo que Europa exige y no sabe cómo especificar

La OTAN publicó sus principios rectores para el uso de inteligencia artificial en defensa — disponibles en el sitio oficial de la alianza bajo el título “Summary of NATO’s Autonomy Implementation Plan”. Son seis: legalidad, responsabilidad y rendición de cuentas, explicabilidad y trazabilidad, confiabilidad, gobernabilidad y mitigación de sesgos. El tercero — explicabilidad y trazabilidad — exige que cualquier decisión tomada por un sistema de IA en un contexto militar pueda ser explicada y rastreada: que haya una cadena verificable entre lo que el sistema percibió, lo que decidió y lo que ejecutó.

Hasta donde se conoce públicamente, no existe evidencia de que los sistemas de IA militar actualmente desplegados cumplan ese principio de forma técnicamente rigurosa, debido a las limitaciones estructurales inherentes al enfoque probabilístico sobre el que están construidos. Las arquitecturas actuales presentan dificultades para garantizar esa trazabilidad sin una capa adicional de verificación formal.

La Unión Europea aprobó en 2024 el Reglamento de Inteligencia Artificial — el AI Act, Reglamento UE 2024/1689. Su artículo 2.3 es explícito: los sistemas de IA utilizados con fines militares o de seguridad nacional quedan excluidos de su ámbito de aplicación. El texto legal es de acceso público en el Diario Oficial de la Unión Europea. La regulación más ambiciosa del planeta sobre inteligencia artificial deja fuera uno de los dominios de mayor impacto potencial.

España aprobó en 2023 su propia Estrategia de IA para la Defensa mediante la Resolución 11197/2023 de la Secretaría de Estado de Defensa, publicada en el Boletín Oficial del Estado. Incluye entre sus líneas prioritarias la autonomía en sistemas no tripulados y el apoyo automatizado a la toma de decisiones en operaciones militares.

El Fondo Europeo de Defensa financia actualmente proyectos de IA militar, sistemas no tripulados y ciberdefensa. Europa invierte. Europa declara principios. Uno de los desafíos pendientes es desarrollar el mecanismo técnico que conecte ambas cosas.

El problema de fondo

Los modelos de inteligencia artificial que hoy se integran en sistemas de drones autónomos y reconocimiento por imagen satelital comparten una propiedad estructural que la literatura técnica denomina alucinación. Es una consecuencia de cómo estos sistemas funcionan: generan la respuesta estadísticamente más probable ante cada situación, pero no disponen de un mecanismo robusto para verificar autónomamente cuándo su salida es incorrecta.

El benchmark TruthfulQA — publicado por Lin, Hilton y Evans en los Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics, 2022 — documentó que el mejor modelo conversacional evaluado respondía con veracidad en el 58% de los casos, frente al 94% de rendimiento humano. Aunque el benchmark fue diseñado para modelos conversacionales, el hallazgo más significativo del estudio es estructuralmente relevante para cualquier sistema basado en la misma arquitectura: los modelos más grandes eran en general los menos veraces, no los más, lo que sugiere que la escala por sí sola no parece resolver completamente el problema. El origen se identifica no en los parámetros del modelo sino en su arquitectura de base.

En un asistente de texto, eso produce información incorrecta. En un sistema autónomo que analiza imágenes satelitales para clasificar objetivos en tiempo real, esos mismos límites arquitectónicos tienen implicancias operativas de otro orden.

“El problema no es que la IA se equivoque. El problema es que no sabe que se equivocó. Y esa diferencia es exactamente lo que el principio de trazabilidad de la OTAN exige resolver: que haya una cadena verificable entre lo que el sistema percibió, lo que decidió y por qué.” — Alejandro Jaime, doctorando en la Facultad de Informática de la UNLP e investigador en sistemas de agentes autónomos radicado en Madrid.

A modo de contexto, sistemas de IA militar que ya están siendo utilizados en escenarios reales — como el programa Maven del Pentágono, cuya formalización como infraestructura permanente fue confirmada por Reuters y Defense Scoop en marzo de 2026, o el sistema Gospel del ejército israelí, cuyo funcionamiento fue descrito públicamente por el exjefe del Estado Mayor Aviv Kochavi en una entrevista publicada por Ynetnews en junio de 2023 — ilustran la escala a la que estas limitaciones ya tienen implicancias operativas reales.

Una propuesta publicada

Jaime es el investigador detrás de MINERVA, una arquitectura de agentes autónomos cuyas bases teóricas y resultados están bajo revisión en publicaciones académicas con revisión de pares en sistemas distribuidos e inteligencia artificial. Desarrollada en el marco de su tesis doctoral en la UNLP con infraestructura propia y operada desde Madrid, la propuesta ofrece un enfoque arquitectónico para abordar el problema.

El principio es directo: en lugar de intentar eliminar la incertidumbre del modelo — algo para lo cual no existe actualmente una solución general — interpone una capa de verificación sobre las decisiones generadas. Las decisiones críticas pasan previamente por verificadores formales: funciones deterministas, sin ambigüedad estadística, que evalúan si esa decisión es consistente con el estado conocido del sistema, si viola restricciones previamente definidas, y si puede ejecutarse dado lo que el agente efectivamente sabe — y no lo que cree saber.

El resultado apunta a lo que el principio de explicabilidad y trazabilidad de la OTAN exige: cada decisión tiene una cadena formal verificable, una verificación determinista que complementa la salida probabilística del modelo.

La analogía más directa viene de la aviación: el TCAS es el sistema que puede anular cualquier instrucción del piloto automático si detecta riesgo de colisión. Dos capas de decisión en el mismo sistema: una probabilística y adaptativa, la otra determinista y regida por restricciones formales. Aplicado a un drone autónomo, significa que las clasificaciones generadas por IA sobre una imagen satelital pasan previamente por esa capa de verificación formal antes de llegar al operador.

El componente verificador puede ejecutarse en hardware de bajo consumo por diseño: es una función determinista, no un modelo neuronal, y no depende necesariamente de aceleradores de alto rendimiento — comparable en ese sentido al procesador RAD6000 de 25 MHz con el que la NASA operó el sistema de control autónomo Remote Agent en la misión Deep Space 1 en 1999, documentado por el Jet Propulsion Laboratory, que tomó decisiones autónomas de navegación sin supervisión humana durante una semana a 65 millones de millas de la Tierra.

El mismo principio aplica más allá del dominio militar: diagnóstico clínico automatizado, detección de fraude financiero en tiempo real, auditoría de contratos inteligentes, asistencia legal automatizada. En todos esos contextos el problema de fondo es el mismo y el enfoque arquitectónico para mitigarlo también.

No es un camino solitario: grupos de investigación de Microsoft Research — en el paper VeriGuard, publicado en arXiv en octubre de 2025 — y otros laboratorios internacionales publicaron en 2025 y 2026 arquitecturas que convergen en el mismo principio desde ángulos distintos, lo que sugiere que la verificación formal como capa de seguridad en agentes autónomos está consolidándose como dirección emergente del campo.

El momento político

El secretario general de la ONU António Guterres anunció — según documentación de la Unión de Asociaciones de las Naciones Unidas — que su Nueva Agenda para la Paz llama a concluir antes de fin de 2026 las negociaciones sobre un instrumento jurídicamente vinculante para sistemas de armas autónomas. La Convención sobre Ciertas Armas Convencionales lleva años debatiendo el marco regulatorio en Ginebra sin resultados vinculantes concretos.

La cumbre de la OTAN en Ankara va a discutir inversiones en drones y sistemas de IA. La ONU va a intentar acordar cómo regularlos. Los dos procesos corren en paralelo y apuntan al mismo desafío: el principio del control humano significativo está escrito en todos los documentos. El enfoque técnico para implementarlo, aún no.

El debate europeo sobre soberanía tecnológica en defensa y la necesidad de que los principios de trazabilidad de la OTAN tengan una implementación técnica real encuentran en esta propuesta un punto de convergencia. La arquitectura se encuentra documentada en publicaciones académicas, desarrollada en un entorno académico independiente.