Un argentino construyó el primer agente autónomo conocido que aprende sin alucinar

Las alucinaciones de la inteligencia artificial ya provocaron sanciones a abogados, condenasjudiciales contra aerolíneas, errores médicos documentados y casi 1.400 causas judiciales relevadas en todo el mundo.

Mientras los gigantes de Silicon Valley intentan parchear el problema con documentación, un doctorando de la Universidad Nacional de La Plata construyóla primera arquitectura conocida que combina aprendizaje adaptativo con eliminación estructural de alucinaciones — y cumple, por construcción, el reglamento europeo de IA. Se llama MINERVA.

En una habitación, en un pueblo de Madrid, hay una notebook conectada a un monitor externo. Es ahí donde un investigador argentino escribe el código de lo que algunos colegas europeosempiezan a describir como
la primera arquitectura conocida de agente autónomo capaz de cumplir, por construcción, el reglamento europeo de inteligencia artificial. No hay un equipode cien personas. No hay un campus corporativo. No hay un fondo de capital de riesgo esperando en la puerta. Hay un doctorando, una conexión a la red académica europea, una infraestructura pública de ciencia abierta — y un problema que hoy tiene en jaque a Silicon Valley.

El problema es viejo y bien conocido por cualquiera que haya usado ChatGPT: las alucinaciones. La inteligencia artificial inventa hechos con la misma convicción con la que enuncia los verdaderos. Lo nuevo es que ese problema dejó de ser una rareza tecnológica y empezó a generar consecuencias jurídicas, económicas y humanas reales.

Hace dos años, la Unión Europea aprobó el reglamento de inteligencia artificial más ambicioso del mundo. El AI Act exige que los sistemas de IA sean trazables, auditables, explicables y precisos. Las grandes empresas del sector — OpenAI, Google, Meta, Anthropic — deben demostrar que sus modelos cumplen esos requisitos para operar en territorio europeo, bajo amenaza de multas de hasta el 7% de su facturación global.

Hay un problema incómodo: los grandes modelos de lenguaje — ChatGPT, Gemini, Claude — son
por diseño incapaces de cumplirlos.

No es una opinión polémica. Es matemática. Un modelo de lenguaje predice secuencias depalabras estadísticamente probables, no recupera verdades. Sus cientos de miles de millones deparámetros no tienen semántica individual auditable. Su comportamiento ni siquiera es reproducible al bit. Sus supuestas “explicaciones” son reconstrucciones a posteriori, no fieles al cómputo real. Pedirle a un modelo de lenguaje que sea trazable es como pedirle a un casino que sea predecible.

El resultado, que varios reguladores europeos reconocen en privado, es un régimen de cumplimiento teatral
: documentación prolija, model cards, reportes voluntarios — y un enforcement real que probablemente no llegará antes de 2028. Para entonces, los modelos actuales serán reliquias.

LA SALIDA FUE INVERTIR EL PROBLEMA

Trabajando entre Madrid y La Plata, el investigador argentino Alejandro Jaime — doctorando en la Facultad de Informática de la Universidad Nacional de La Plata, bajo la dirección de Marcelo Errecalde, Leticia Cagnina y Verónica Gil-Costa (Universidad Nacional de San Luis) — desarrolló una arquitectura que no intenta hacer auditable un modelo de lenguaje. Sería imposible. Lo que hace es convertir la alucinación en arquitectónicamente irrelevante.

La arquitectura se llama MINERVA. Y su tesis es contraintuitiva: el modelo de lenguaje no decide nada. Solo percibe.

En MINERVA, el núcleo que toma decisiones es código simbólico determinista — un sistemaclásico de creencias, deseos e intenciones (paradigma BDI, con tres décadas de robustez enagentes autónomos) acoplado a un planificador jerárquico de tareas. Ese núcleo es inspeccionable línea por línea, reproducible al bit, formalmente verificable. El modelo delenguaje queda confinado a un único rol:
leer el mundo.

“Lo simbólico decide. Lo neural percibe. Si el modelo se equivoca, el sistema lo detecta antes de que la equivocación toque la lógica de negocio.”

Esa frontera entre percepción y decisión no es una metáfora. Es un componente concreto que sellama
EVR (Epistemic Verification Gate, compuerta de verificación epistémica). Filtra todo loque el modelo de lenguaje dice antes de que entre al núcleo decisor: verifica frescura del dato,origen, consistencia con creencias previas, firma criptográfica de procedencia. Si el modelo alucina, EVR lo descarta. La alucinación nunca llega a la decisión.

EL COMPNENTE QUE APRENDE SIN ROMPER LA GARANTÍA

El segundo componente — y la razón por la que el sistema escala a contextos diversos — se llama
EMRE. Es la primera aplicación documentada de aprendizaje por refuerzo con retroalimentación humana (RLHF) y mezcla de expertos (Mixture of Experts) a la frontera epistémica de unagente BDI.

Lo que hace EMRE es calibrar la percepción por dominio. La exigencia de confianza no es la misma en banca que en salud, ni en salud que en administración pública. EMRE aprende esos umbrales de forma adaptativa,
sin tocar nunca el núcleo decisor. La taxonomía clásica de HenryKautz (2022) sobre sistemas neurosimbólicos — la referencia académica del campo — no contemplaba esa posibilidad. MINERVA la implementa.

La combinación de las dos piezas — EVR que filtra y EMRE que aprende — convierte aMINERVA en la
primera arquitectura de agente autónomo que reúne, simultáneamente, tres propiedades que hasta ahora aparecían como mutuamente excluyentes: aprendizaje adaptativo, decisión determinista y eliminación estructural de la alucinación.

En lenguaje llano: el sistema aprende a ser más cauto donde el contexto exige cautela y más fluido donde la exigencia es menor, sin que ese aprendizaje pueda corromper jamás la lógica quetoma las decisiones críticas.

EL PRECIO REAL DE LA ALUCINACIÓN

Para entender por qué esto importa, conviene salir del laboratorio y mirar los tribunales.

En mayo de 2023, en Mata v. Avianca (caso 22-cv-1461, distrito sur de Nueva York), dos abogados estadounidenses fueron sancionados por presentar un escrito con seis precedentes judiciales
completamente inventados por ChatGPT. La aerolínea colombiana Avianca era la demandada,pero el escándalo terminó arrastrando a los letrados, no a la empresa.

En febrero de 2024, en Moffatt v. Air Canada (2024 BCCRT 149), el tribunal de Columbia Británica obligó a la aerolínea a pagar el reintegro completo a un pasajero al que su propio chatbot le había alucinado una política de tarifa por duelo que no existía. La defensa de AirCanada — alegar que el chatbot era “una entidad legal separada” — fue calificada por el tribunalcomo “una sumisión extraordinaria”.

En 2024, Zhang v. Chen (2024 BCSC 285) condenó en costas a una abogada canadiense por citardos fallos inexistentes producidos por ChatGPT. Un año después, en Ko v. Li (2025 ONSC 2985), otra letrada enfrentó actuaciones por desacato tras invocar tres precedentes inventados ante un tribunal de Ontario. En Specter Aviation v. Laprade (2025 QCCS 352), una persona sin patrocinio letrado fue multada con 5.000 dólares canadienses por presentar jurisprudencia fabricada poruna IA.

El chatbot MyCity del gobierno municipal de Nueva York fue documentado mientras aconsejabaa pequeños empresarios prácticas comerciales explícitamente ilegales bajo la legislación local. El modelo
Whisper de OpenAI, ampliamente usado en transcripción médica, ha sido reportado insertando frases violentas, referencias raciales y tratamientos imaginarios en transcripciones deconsultas clínicas reales.

El relevamiento más sistemático del fenómeno — la base de datos del jurista Damien Charlotin— contabiliza ya 1.394 decisiones judiciales en todo el mundo donde una parte presentó contenido alucinado por una IA. La cifra crece varias decenas por mes.

La industria ofrece, hoy, dos respuestas: detectores estadísticos de alucinación (que fallan, según estudios reproducibles, en hasta el 83% de los casos productivos) y disclaimers legales en lostérminos de servicio. Ninguna de las dos resuelve el problema. Lo desplazan.

MINERVA toma el camino opuesto: eliminar la alucinación como categoría arquitectónica. Si la decisión nunca depende de lo que el modelo de lenguaje afirma — sólo de lo que la compuerta epistémica deja pasar —, entonces el problema deja de existir en el sentido en que existía hasta ahora.

POR QUÉ LE IMPORTA EL REGULADOR EUROPEO

El AI Act no es teoría. El artículo 9 exige gestión de riesgos, el 12 logging trazable, el 13 transparencia, el 14 supervisión humana, el 17 sistemas de calidad. Cada uno de esos artículos mapea, uno a uno, a un componente concreto de MINERVA. No por compliance añadido aposteriori. Por construcción.

Esto importa porque, fuera de Bruselas, el problema es práctico. Un agente autónomo que clasifica documentos fiscales no puede inventar categorías. Un agente que monitorea operaciones bancarias no puede alucinar transferencias. Un agente clínico no puede sintetizar dosis. En esos sectores — banca, salud, legal, administración pública — los marcos populares basados puramente en modelos de lenguaje, como Lang Chain, AutoGen o CrewAI, son hoy jurídicamente inviables en Europa.

MINERVA es la única arquitectura conocida que ocupa el cuadrante de “expresividad dellenguaje natural + garantías formales de determinismo”. El resto del campo está, o bien en el cuadrante expresivo sin garantías (los marcos modernos), o bien en el cuadrante con garantías sin expresividad (los sistemas multiagente clásicos tipo JADE o Jason).

En experimentación reproducible sobre corpus reales — más de dos mil documentos legales — la arquitectura alcanzó cerca del 91% de exactitud verificada por dos profesionales independientes del dominio. Cero alucinaciones estructurales reportadas en los registros experimentales.

LAS VENTAJAS CONCRETAS — Y DÓNDE ENCAJAN

La conversación con responsables de tecnología cambia cuando MINERVA se compara, característica por característica, contra los marcos populares. Las propiedades que aporta no son retóricas:

Reproducibilidad al bit: el mismo input produce siempre el mismo output. Cualquier auditor puede repetir la decisión y verificarla.

Trazabilidad criptográfica de cada creencia: si una decisión se cuestiona en tribunales, hay constancia firmada de qué dato la informó y de dónde provino ese dato.

Aprendizaje sin riesgo: EMRE adapta la calibración por dominio sin alterar jamás el núcleodecisor. Lo que aprende no puede corromper lo que decide.

Independencia de proveedor: el modelo de lenguaje es una pieza intercambiable —OpenAI, Anthropic, Mistral, modelos abiertos —. El núcleo simbólico es propiedad deloperador, no del proveedor de IA.

Soberanía de datos: la arquitectura puede operar enteramente on-premise, sin enviar información sensible a servidores de Silicon Valley o de Beijing.

Costo predecible: el modelo de lenguaje sólo se invoca para percibir, no para razonar iterativamente. El consumo es medible y acotable de antemano.

EUROPA: EL REGULADOR YA NO ES EL ÚNICO ACTOR

Más allá del AI Act, DORA — el Reglamento de Resiliencia Operativa Digital, vigente desde enero de 2025 — obliga a los bancos europeos a demostrar trazabilidad y auditabilidad en cadasistema crítico. El artículo 5 (1)(d) del GDPR ya generó investigaciones contra OpenAI por output falso sobre personas identificables. Y la
MDR (Reglamento de Dispositivos Médicos) exige garantías equivalentes para cualquier IA aplicada a salud.

La estrategia europea de IA soberana avanzó en el plano de los modelos — Mistral en Francia, Aleph Alpha en Alemania, Silo AI en Finlandia —, pero queda un hueco evidente: falta la capa deagentes autónomos compatible con la regulación. Ese hueco es el que MINERVA ocupa. No compite contra OpenAI o Anthropic; los integra como subrutinas controladas.

ARGENTINA: UNA VENTANA QUE CONVIENE NO PERDER

La Argentina tiene Ley de Protección de Datos Personales (25.326) vigente, un proyecto deregulación de IA en debate en el Congreso, y una infraestructura académica — UNLP, UNSL, FAMAF, Exactas UBA — con capacidad demostrada para absorber y producir tecnología defrontera. También tiene un sistema judicial que ya enfrenta el problema directo: en los últimos dos años se documentaron casos en la región de letrados presentando jurisprudencia inventadapor IA, con consecuencias disciplinarias y reputacionales concretas.

Los sectores donde el encaje es inmediato no son hipotéticos: la banca regulada por el BCRA, el sistema previsional, la administración tributaria nacional y provincial, la justicia federal y los superiores tribunales
provinciales, las obras sociales y el sistema sanitario público y privado, las empresas reguladas del sector energético. En todos esos ámbitos, una alucinación no es una anécdota: es responsabilidad civil, daño patrimonial o un derecho vulnerado.

Y hay una ventaja geopolítica que rara vez se nombra en voz alta. Una arquitectura desarrollada desde la Argentina, basada en infraestructura académica europea pública, no está atada alecosistema Silicon Valley ni al ecosistema chino. En un escenario de tensión tecnológica creciente entre bloques, eso es soberanía técnica concreta — no eslogan.

El resto del Sur Global Brasil ya tiene la LGPD vigente y un proyecto avanzado de regulación de IA. México, Chile y Colombia están modernizando sus marcos de protección de datos y supervisión algorítmica. India desplegó normativa específica para sistemas de alto riesgo. En todos esos mercados, las grandes plataformas estadounidenses y chinas llegan con productos cerrados, opacos y noauditables. Una arquitectura abierta a auditoría, configurable por dominio y desarrollada desde una universidad latinoamericana es, simplemente, una opción de mercado que hoy no existe.

UNA INFRAESTRUCTURA ACADÉMICA IMPROBABLE

La historia tiene un subtexto que vale la pena nombrar. La frontera de la inteligencia artificial soberana
— la que no depende ni de Silicon Valley ni de Beijing — se está construyendo, también, desde universidades del Sur Global y desde infraestructuras de ciencia abierta europeas que aún preservan independencia respecto del capital privado.

La Plata aporta la formación doctoral y la dirección académica: la Universidad Nacional de La Plata sigue siendo, en 2026, una de las facultades de informática con mayor producción científica indexada en Latinoamérica. San Luis suma la codirección desde la Universidad Nacional de San Luis, con tres décadas de tradición en sistemas inteligentes. Madrid funciona como baseoperativa para la investigación experimental.
Y por encima de los anclajes geográficos, Zenodo — el repositorio de ciencia abierta operado porel CERN en Ginebra, financiado por la Comisión Europea — opera como ancla de soberanía documental. Cada paper
depositado en Zenodo queda bajo custodia de una infraestructurapública europea, con DOI permanente, fuera del alcance de servidores corporativos privados. Noes un detalle menor: el debate global sobre IA soberana está empezando a converger sobre la pregunta de quién custodia el conocimiento sobre cómo construirla.

Sin presupuestos de mil millones de dólares. Con un investigador que financia sus propiasestadías de investigación, mientras sostiene un portafolio activo de papers en revisión y publicación en algunos de los venues más exigentes del campo: Knowledge-Based Systems, Expert Systems with Applications, Information Fusion, Applied Intelligence, IEEE Transactions on Parallel and Distributed Systems, IEEE Transactions on Dependable and Secure Computing, Journal of Parallel and Distributed Computing, además de lasconferencias
AAMAS e IEEE Software.

“Cuando el regulador descubra, hacia 2028, que su régimen actual es indistinguible de notener régimen, las arquitecturas que nacieron compliant by design serán las únicas que pasen una auditoría sustantiva. El resto va a tener que rediseñar desde cero.”

La defensa de tesis está prevista para enero de 2027. Mientras tanto, en una habitación de unpueblo de Madrid, la notebook sigue conectada al monitor externo. Y en La Plata, en San Luis, y en un puñado de despachos académicos europeos que empiezan a prestar atención, una pregunta empieza a circular en voz baja.

¿Y si la inteligencia artificial que Europa exige — y que Silicon Valley no puede entregar — la está construyendo, en silencio, un investigador argentino?