Fundamentos15 de mayo de 2026· 5 min de lectura

Lo que la IA no puede hacer (todavía): los límites reales en 2026

La IA es capaz de cosas impresionantes. Pero alucina, no actualiza, no comprende y no puede actuar en el mundo físico. Los límites reales que importa conocer.

En 2026 la IA genera texto, imágenes, código, música y video. Mantiene conversaciones complejas, analiza documentos legales, supera exámenes de medicina y derecho. La narrativa dominante en los medios es la de las capacidades. Lo que se habla menos son los límites, que son reales, significativos y que importa entender para usar la herramienta de forma efectiva y no llevarse sorpresas desagradables.

Las alucinaciones: cuando inventa con la misma confianza

Es el problema más conocido y el más importante. Los modelos de lenguaje generan texto que es estadísticamente plausible dado el contexto. No tienen acceso a una base de datos de hechos verificados que consulten antes de responder. El resultado: a veces generan información incorrecta con el mismo tono seguro y fluido que usan para la información correcta.

Algunos ejemplos documentados: citar artículos académicos que no existen, atribuir afirmaciones a personas que nunca las hicieron, dar fechas incorrectas de eventos históricos, generar normativas legales que mezclan partes reales con partes inventadas.

La frecuencia de alucinaciones varía por modelo y por tipo de tarea. Los modelos más recientes alucina menos, especialmente en dominios bien cubiertos durante el entrenamiento. Pero ningún modelo en 2026 es libre de alucinaciones, y el problema no está resuelto a nivel fundamental.

Consecuencia práctica: cualquier información factual concreta que genere la IA (nombres, fechas, cifras, referencias, normativas) merece verificación antes de usarse profesionalmente. Para razonamiento y síntesis, la fiabilidad es alta. Para hechos específicos, no.

La fecha de corte: no sabe qué pasó ayer

Los modelos se entrenan con datos hasta una fecha determinada. Después de esa fecha, no saben nada de lo que ha pasado en el mundo. Si le preguntas a un modelo con corte en septiembre de 2025 por algo que ocurrió en noviembre de 2025, o no lo sabe o lo inventa.

La fecha de corte no se soluciona completamente con la navegación web: cuando el modelo puede buscar en internet, mejora significativamente para información actualizada. Pero el razonamiento profundo sobre eventos recientes sigue siendo menos fiable que sobre temas bien cubiertos en el entrenamiento.

Consecuencia práctica: para cualquier pregunta sobre eventos, precios, personas o normativas recientes, activa la navegación web o usa Perplexity.

Las matemáticas: mejor de lo que era, lejos de perfecto

Este límite sorprende a muchos porque la IA escribe sobre matemáticas de forma fluida. Pero fluidez y corrección no son lo mismo. Los modelos de lenguaje son mejores en matemáticas que hace dos años gracias a técnicas de entrenamiento específicas (especialmente los modelos razonadores como o3). Pero siguen cometiendo errores en cálculos complejos o encadenados, especialmente cuando el problema tiene muchos pasos.

La solución que los propios modelos ofrecen: activar la ejecución de código. Cuando el modelo puede escribir y ejecutar Python para resolver el cálculo, los resultados son mucho más fiables porque el cálculo lo hace la máquina, no el modelo.

Consecuencia práctica: para matemáticas más allá de operaciones simples, pide al modelo que resuelva el problema ejecutando código, no generando texto con la respuesta directamente.

La comprensión profunda: ¿entiende o solo parece que entiende?

Esta es la discusión más filosófica y la que genera más debate en la comunidad investigadora. Los modelos de lenguaje no tienen comprensión en el sentido humano: no tienen una representación del mundo, no tienen experiencias, no sienten curiosidad. Lo que tienen es una capacidad extraordinaria para generar texto que es coherente y apropiado en contexto, basado en patrones del texto con el que fueron entrenados.

En la práctica, la distinción importa en casos límite: preguntas que requieren sentido común sobre el mundo físico (¿puede caber un sofá por esta puerta?), inferencias sobre estados mentales complejos, o situaciones genuinamente nuevas sin precedentes en el texto de entrenamiento. En esos casos el modelo puede fallar de formas que un humano no fallaría.

Consecuencia práctica: la IA es muy buena en tareas bien definidas y con muchos ejemplos en el entrenamiento. En situaciones ambiguas, inusuales o que requieren experiencia del mundo real, las respuestas merecen más escrutinio.

La acción en el mundo físico

Los modelos de lenguaje son software. No pueden hacer nada en el mundo físico por sí mismos. Pueden generar texto sobre cómo hacer algo, pero hacer la cosa es siempre responsabilidad humana. Los agentes de IA pueden actuar en sistemas digitales (enviar emails, buscar en internet, ejecutar código), pero no pueden salir de los límites de lo digital.

Esta limitación parece obvia pero tiene consecuencias en expectativas: la IA no puede implementar nada que hayas pedido, solo ayudarte a prepararlo. Tú sigues siendo quien ejecuta.

Lo que está mejorando y lo que no

Mejorando de forma clara: las alucinaciones (menos frecuentes en los mejores modelos), la capacidad matemática (con razonadores), el acceso a información actualizada (con herramientas de búsqueda).

Sin resolución fundamental: el problema de alucinaciones no está resuelto en la arquitectura base. El entendimiento genuino es una frontera abierta en la investigación. La actuación autónoma en el mundo real está en sus primeros pasos y tiene problemas de fiabilidad.

Conocer los límites de la IA no es pesimismo. Es la condición previa para usarla bien. Las herramientas que se usan sin entender sus limitaciones producen errores caros. Las que se usan con conciencia de cuándo son fiables y cuándo no, producen resultados consistentemente útiles.

La IA en 2026 es extraordinariamente capaz en un conjunto bien definido de tareas. Fuera de ese conjunto, tiene fallos predecibles. Saber dónde está la frontera es la diferencia entre un usuario que depende de la herramienta de forma inteligente y uno que se lleva decepciones regulares.

Newsletter gratuita

Empieza mañana.

Un uso práctico de la IA cada dos días. Sin tecnicismos. Gratis en tu correo.

← Volver al blog