Los antecedentes de la inteligencia artificial (IA). 1ª parte

Escribo un par de artículos a la semana, pero hay veces que me salto alguno. No es que esté un poco más perezoso, sino que escribir me supone una labor importante de recopilación de datos. Me molesta no tener todos los datos cuando hablo de algo, porque no me interesa ser un 'todologo'. Suelo ayudarme de una plataforma multiagente que hemos desarrollado, para documentarme. Antes los hacía 'a pelo', pero luego tengo que leerme los artículos que me enlaza, los documentos que soportan los datos y luego escribir. A veces hago uno o dos artículos al día (siempre en fin de semana), pero a veces me lleva dos o tres fines de semana completos.

[Img #12926] Hoy es uno de esos artículos que me ha llevado un par de semanas. Recopilé muchos datos de IBM como auténtico precursor de la IA en los años 50 y 60 del pasado siglo, pero, la automatización del lenguaje, los 'modelos de lenguaje' están en la mente de la ciencia ficción desde hace siglos. Como algunos peinamos canas, y estudiamos informática cuando los bits se oían (acopladores acústicos antes que módems), vamos, el pleistoceno de la Informática (edad del hierro de la IA, más o menos), me he aventurado a recopilar.

¿De dónde surge este artículo?: El otro día, un amigo me preguntó por los antecedentes de la IA. Entre que soy un poco compulsivo, fui recopilando datos y… Al final salió esto:

Una máquina de palabras en Los viajes de Gulliver: un poco de Imaginación

La imaginación humana empezó mucho antes. La ciencia ficción siempre ha sido una cantera para los nuevos desarrollos humanos. Primero imaginamos y varias generaciones posteriores, alguien desarrolla algo que mula la literatura de años antes.

En la tercera parte de Los viajes de Gulliver (1726), Jonathan Swift lleva a su protagonista a la isla flotante de Laputa. Allí describe un artefacto llamado “Engine” (motor) que permite a personas ignorantes escribir tratados de cualquier disciplina. La máquina consta de una gran superficie con dados de madera cubiertos por papel en el que están escritos todos los verbos y sustantivos del idioma. Al girar las manivelas, los cubos reorganizan aleatoriamente las palabras y los alumnos leen en voz baja las combinaciones para formar frases completas. Según la Computer History Museum, este dispositivo satírico es una de las primeras menciones literarias de una máquina computacional: podría verse como un generador aleatorio de textos, capaz de producir prosa y poesía de forma puramente mecánica. Un modelo de lenguaje que escribe aleatoriamente, algo similar a un chat versión -200, antes de GPT.

Aunque Swift ridiculiza a los 'proyectores' de su época, su Engine anticipa la idea de utilizar reglas y permutaciones para crear contenido, un principio que hoy subyace en modelos de generación de lenguaje natural. La curiosidad por máquinas que combinan símbolos para obtener nuevos significados es una constante en la historia de la IA.

Las combinaciones lógicas de Ramón Llull

Dos siglos antes de Swift, el filósofo mallorquín Ramon Llull ideó un método para demostrar racionalmente las verdades del cristianismo. En su obra Ars generalísima (1305) describió un sistema de círculos concéntricos de papel con letras o símbolos que representaban atributos divinos como la bondad, la sabiduría o la eternidad. Al girar los discos se generaban diferentes combinaciones de conceptos y se podían derivar conclusiones lógicas.

El objetivo de Llull era debatir con musulmanes y judíos mediante argumentos lógicos, pero su método constituye uno de los primeros intentos de automatizar el razonamiento. En palabras de la History of Information, Llull “inventó numerosas máquinas” para combinar ideas y su círculo permitió generar todas las verdades posibles a partir de un conjunto limitado de principios. Giordano Bruno y más tarde Gottfried Leibniz retomaron estos ejercicios de combinatoria, reconociendo en Llull a un precursor del pensamiento algorítmico.

Leibniz: cálculos, combinaciones y el sueño de un lenguaje universal

El filósofo alemán Gottfried Wilhelm Leibniz (1646‑1716) llevó la idea de la combinatoria a una visión más ambiciosa. Además de destacar por el cálculo diferencial, inventó una máquina calculadora con engranajes que realizaba operaciones de suma, resta, multiplicación y división mediante un manillar giratorio. Aunque su aparato sufrió problemas mecánicos y no siempre funcionó correctamente, inspiró a generaciones posteriores. El científico Norbert Wiener lo llamó el “patrón santo” de la cibernética.

En su Dissertatio de arte combinatoria (1666), Leibniz propuso una “arte de las combinaciones” que permitiría descomponer ideas complejas en elementos básicos y recombinarlos para generar nuevos conocimientos. Describió esta arte como la “madre de todas las invenciones” y aspiró a que condujera al descubrimiento de “todas las cosas”. Su visión de una characteristica universalis (lenguaje universal) y de una herramienta lógica para resolver disputas —resume en su célebre “Calculemus!” (“¡calculemos!”)— prefigura la idea de programar el pensamiento.

De calculadoras mecánicas a ordenadores: Babbage y Lovelace

En el siglo XIX, el matemático británico Charles Babbage diseñó las primeras máquinas de cálculo completamente automáticas. Su Máquina Diferencial Nº 1 (1821) calculaba tablas polinómicas mediante el método de las diferencias finitas y estaba concebida para imprimir los resultados automáticamente (una calculadora, vamos).

Más ambicioso aún fue su diseño de la Máquina Analítica (1834), un dispositivo programable con tarjetas perforadas inspirado en los telares de Jacquard. La máquina distinguía una “tienda” (memoria) y un “molino” (unidad de procesamiento) y podía ejecutar ciclos de instrucciones, saltos condicionales y otras funciones que hoy asociamos a los ordenadores modernos.

Aunque la Máquina Analítica nunca se construyó completamente, la matemática Ada Lovelace intuyó su potencial más allá del cálculo numérico al sugerir que podría componer música y manipular símbolos. Esta visión —mezcla de ingeniería y creatividad— constituye otro antecedente conceptual de la IA.

El teleautómata de Nikola Tesla

A finales del siglo XIX, la idea de máquinas autónomas se materializó de forma sorprendente. En 1898, Nikola Tesla presentó en el Madison Square Garden de Nueva York un pequeño bote de hierro controlado por radiofrecuencia. Tesla lo describió como dotado de una “mente prestada”.

Según la cadena pública PBS, el barco era el primer vehículo controlado a distancia; respondía a las señales de un transmisor y contenía un equipo interno alimentado por batería. Tesla demostró que su “teleautómata” podía contestar preguntas básicas encendiendo luces y, cuando un periodista insinuó que podría convertirse en un torpedo, replicó que se trataba “del primero de una raza de robots, hombres mecánicos que harán el trabajo laborioso de la humanidad”. Este invento adelanta el concepto de robots teledirigidos y plantea por primera vez la posibilidad de máquinas con comportamiento autónomo.

El Ajedrecista de Torres y Quevedo

En 1912, el ingeniero español Leonardo Torres y Quevedo construyó El Ajedrecista, un autómata que jugaba el final de ajedrez rey y torre contra rey. La máquina utilizaba electroimanes bajo el tablero para mover las piezas y sensores para detectar las jugadas del oponente. Su algoritmo, aunque no siempre daba el mate más rápido, era capaz de dar jaque mate de forma totalmente autónoma en cualquier posición, lo que lo convierte en uno de los primeros dispositivos con capacidad de decisión programada. El invento, fue presentado en la Exposición Universal de París de 1914, causando gran expectación. La revista Scientific American destacó en 1915 que el ingeniero quería “sustituir la mente humana por la maquinaria”, anticipando la fascinación y el temor hacia las máquinas inteligentes.

Literatura visionaria del siglo XX y el cine: Frankenstein, R.U.R. y HAL

La imaginación literaria ha sido clave para reflexionar sobre la creación artificial de seres inteligentes. Mary Shelley publicó en 1818 Frankenstein o el moderno Prometeo, una novela donde un científico da vida a un ser artificial que escapa de su control. Más de un siglo después, en 1921, el escritor checo Karel Čapek estrenó la obra R.U.R. (Rossum’s Universal Robots).

Según el MIT Press Reader, la palabra “robot” deriva del término checo robota que significa “trabajo forzado” o servidumbre. Čapek utilizó el término para criticar la mecanización y explorar cómo la creación de seres artificiales puede deshumanizar a los trabajadores. Estas obras no describen máquinas reales, pero plantean dilemas éticos que siguen vigentes en la IA moderna.

En 1968, 2001 Odisea espacial de Stanley Kubrik, presenta un ordenador HAL, gobernado por IA que es capaz de aniquilar a todo aquel que intente desconectarlo.

Redes neuronales y la prueba de Turing

Mientras los ingenieros construían artefactos mecánicos, los científicos comenzaron a teorizar sobre cómo reproducir el pensamiento. En 1943, el neurofisiólogo Warren McCulloch y el lógico Walter Pitts publicaron el primer modelo matemático de una red neuronal artificial.

En A Logical Calculus of the Ideas Immanent in Nervous Activity, demostró que redes de elementos simples podían realizar tareas computacionales complejas. Este trabajo, inspirado en la obra de Alan Turing, sentó las bases de la neurocomputación y anticipó los algoritmos de aprendizaje automático.

En 1950, el matemático británico Alan Turing propuso un experimento para responder a la pregunta “¿pueden pensar las máquinas?”. En su artículo Computing Machinery and Intelligence, sugirió sustituir la cuestión filosófica por un “juego de imitación”: un interrogador conversa por escrito con dos participantes, uno humano y una máquina, tratando de descubrir cuál es cuál.

Según la Stanford Encyclopedia of Philosophy, Turing consideraba que el debate sobre si las máquinas piensan era “demasiado sin sentido” y prefería debatir si una computadora digital podía ganar ese juego. Estimó que en unas décadas las máquinas podrían engañar a un interrogador en al menos el 70 % de los casos. Esta “prueba de Turing” se convirtió en una referencia central para medir el progreso de la IA.

1943

Warren S. McCulloch y Walter Pitts publican «A Logical Calculus of the Ideas Immanent in Nervous Activity» en el Bulletin of Mathematical Biophysics. Es una de las obras seminales en la historia de la neurociencia y de la IA.

El artículo sienta las bases de la idea de que el cerebro puede entenderse como un sistema computacional e introduce el concepto de redes neuronales artificiales, ahora una tecnología clave en la IA moderna. Esta idea inspira sistemas informáticos que simulan funciones y procesos similares a los del cerebro, particularmente a través de redes neuronales y aprendizaje profundo.

1951, la SNARC

Marvin Minsky y Dean Edmunds construyen la primera red neuronal artificial. La Stochastic Neural Analog Reinforcement Calculator (SNARC) es un primer intento de modelar los procesos de aprendizaje en el cerebro humano, específicamente a través del aprendizaje por refuerzo.

SNARC está diseñado para simular el comportamiento de una rata que transita por un laberinto. La idea es hacer que la máquina imite la forma en que los animales aprenden a través de recompensas y castigos, ajustando su comportamiento a lo largo del tiempo según la retroalimentación. Es una computadora analógica que emplea una red de 3000 tubos de vacío junto con pesos sinápticos para simular 40 unidades similares a neuronas.

Allen Newell, 1952

Allen Newell, matemático y científico informático, y Herbert A. Simon, politólogo, desarrollan programas influyentes, como Logic Theorist y General Problem Solver, que están entre los primeros en imitar las capacidades humanas de resolución de problemas mediante métodos computacionales.

El nacimiento oficial de la IA: Dartmouth 1956

El término “inteligencia artificial” apareció formalmente en 1956. Ese verano, un grupo de científicos liderado por John McCarthy, Marvin Minsky, Nathaniel Rochester y Claude Shannon organizó en el Dartmouth College un taller de investigación donde plantearon que “la inteligencia de una máquina” podía estudiarse científicamente.

Su propuesta definía la IA como “la ciencia e ingeniería de hacer máquinas inteligentes” y afirmaba que “todo aspecto del aprendizaje o cualquier otra faceta de la inteligencia puede, en principio, describirse con tal precisión que se pueda construir una máquina que la simule”.

El encuentro reunió a pioneros como Allen Newell, Herbert Simon, Arthur Samuel y Ray Solomonoff y se considera el acta de nacimiento de la IA como disciplina. Aunque los participantes eran optimistas y creían que lograrían avances decisivos en dos veranos, la complejidad de la tarea obligó a décadas de investigación. El taller de Dartmouth desencadenó la creación de laboratorios y programas universitarios dedicados a la IA y abrió debates que siguen vigentes: ¿cómo deben cooperar las máquinas y las personas?, ¿qué impactos sociales y éticos tienen los sistemas inteligentes?

1959 Oliver Selfridge y el modelo Pandemonium

Selfridge publicó “Pandemonium: A Paradigm for Learning”, donde propuso una arquitectura jerárquica para el reconocimiento de patrones. En ella, pequeños “demonios” de bajo nivel identifican líneas y trazos en el estímulo y “gritan” cuando detectan su patrón; demonios de nivel superior escuchan estos gritos para formar características más complejas y, finalmente, un demonio decisor clasifica lo que se ve. Aunque rudimentario, este esquema de procesamiento colaborativo introdujo ideas fundamentales para la visión por computadora y el aprendizaje sin supervisión.

John McCarthy y el Advice Taker: En su trabajo de 1959 “Programs with Common Sense”, McCarthy describió el Advice Taker, un programa pensado para resolver problemas manipulando oraciones en lógica formal. A diferencia de otros sistemas, sus heurísticas debían expresarse en el propio lenguaje formal, permitiendo que el comportamiento del programa se mejorara simplemente añadiendo nuevas proposiciones. McCarthy quería que la máquina dedujera de manera autónoma las consecuencias lógicas de lo que se le indicara —una forma de sentido común— y que aprendiera de la experiencia con una eficacia comparable a la humana. Esta visión abrió el camino a la investigación en representación del conocimiento y razonamiento automatizado.

1965, un gran punto de inflexión

El filósofo Hubert Dreyfus publica «Alchemy and Artificial Intelligence», argumentando que la mente humana funciona de manera fundamentalmente diferente a las computadoras. Predice límites para el progreso de la IA debido a los desafíos de replicar la intuición y la comprensión humanas. Su crítica influye en los debates sobre los límites filosóficos y prácticos de la IA.

I.J. Good escribe «Speculations Concerning the First Ultraintelligent Machine», afirmando de manera muy acertada que una vez que se crea una máquina ultrainteligente, puede diseñar sistemas aún más inteligentes, lo que la convierte en el último invento de la humanidad, siempre que siga siendo controlable. Sus ideas presagian los debates modernos sobre la superinteligencia de la IA y sus riesgos.

Joseph Weizenbaum desarrolla ELIZA, un programa que imita la conversación humana respondiendo a la entrada escrita en lenguaje natural. Aunque Weizenbaum tiene la intención de mostrar la superficialidad de la comunicación entre humanos y computadoras, le sorprende la cantidad de usuarios que atribuyen emociones similares a las humanas al programa, lo que plantea preguntas éticas sobre la IA y la interacción humana.

Edward Feigenbaum, Bruce Buchanan, Joshua Lederberg y Carl Djerassi desarrollaron DENDRAL en la Universidad de Stanford, el primer sistema experto que automatiza el proceso de toma de decisiones de los químicos orgánicos mediante la simulación de la formación de hipótesis. El éxito de DENDRAL marca un avance en la IA, demostrando cómo los sistemas pueden realizar tareas especializadas tan bien como los expertos humanos o mejor.

Retropropagación, una investigación clave para la IA en 2026, en 1969

Arthur Bryson y Yu-Chi Ho presentan la retropropagación, un método para optimizar sistemas dinámicos de múltiples etapas. Originalmente desarrollado para sistemas de control, este algoritmo es clave para entrenar redes neuronales multicapa. Ganó protagonismo entre 2000 y 2019 con la ganancia de capacidad en la potencia de cálculo, lo que permitió el aprendizaje profundo. Después veremos cómo este avance, es realmente el punto de inicio de personajes como Yan Lecun.

Marvin Minsky y Seymour Papert publican Perceptrons: An Introduction to Computational Geometry, que analizó críticamente las limitaciones de las redes neuronales de una sola capa. Este libro, se indica como el que provocó el «invierno de la IA» de casi 20 años.

Los años 70, el invierno de la IA

1970 – SHRDLU y el lenguaje natural. Terry Winograd, investigador del MIT, creó SHRDLU, un programa capaz de conversar en inglés sencillo y manipular objetos en un “mundo de bloques” virtual. El usuario podía ordenar “pon el cono verde sobre el bloque rojo” o preguntar qué había hecho antes, y el sistema respondía moviendo los bloques, nombrando grupos de piezas y contestando preguntas sobre el estado del mundo. Funcionaba en un dominio muy acotado, con unas cincuenta palabras y reglas sencillas, por lo que su aparente comprensión se debía a que controlaba todas las posibilidades en ese escenario.

1972 – MYCIN y los sistemas expertos. En Stanford se desarrolló MYCIN, uno de los primeros sistemas expertos para ayudar a los médicos a diagnosticar infecciones bacterianas y sugerir tratamientos. El programa utilizaba unas 500 reglas basadas en síntomas y pruebas de laboratorio para solicitar más datos, proponer un diagnóstico y justificar sus recomendaciones. Cuando se probó, alcanzó un nivel de acierto comparable al de los especialistas y mejor que el de los médicos generalistas, pero nunca se implantó en hospitales porque surgieron dudas éticas y legales sobre delegar decisiones médicas a una máquina.

1973 – El informe Lighthill y el “invierno de la IA”. A petición del British Science Research Council, el matemático James Lighthill evaluó el estado de la IA en el Reino Unido y concluyó que la investigación no había producido las grandes revoluciones prometidas. El informe criticaba campos clave como la robótica y el procesamiento del lenguaje por sus problemas de “explosión combinatoria” y la falta de resultados aplicables. Este diagnóstico llevó al gobierno británico a recortar drásticamente la financiación de la IA en las universidades, lo que ralentizó el desarrollo del área durante años y generó una actitud escéptica que se conoce como el primer “invierno de la IA”.

Habrá segunda parte. Bueno, hay porque ya la escribí, pero es importante no perder las referencias, por esto escribí sobre esto.

Entender estos antecedentes permite apreciar que la IA contemporánea, lejos de ser una moda pasajera, es el fruto de siglos de ideas que combinan creatividad, ciencia y reflexión ética.

Linkedin: Aquilino García