Por qué Anthropic llamó Claude a su IA y qué tiene que ver Shannon

X (Twitter) Facebook Pinterest Email WhatsApp

¿Por qué Anthropic llamó Claude a su modelo de Inteligencia Artificial? La respuesta más repetida apunta a Claude Shannon, el matemático e ingeniero considerado uno de los grandes padres de la era digital. Anthropic no lo ha convertido en una gran historia oficial de marca, así que conviene tratarlo con prudencia: no es una confirmación corporativa ampliamente documentada, sino una atribución muy extendida y coherente con la historia técnica que hay detrás de los modelos de lenguaje.

La hipótesis encaja demasiado bien como para ignorarla. Claude Shannon fue una figura central en la construcción del mundo computacional moderno. Antes de que existieran internet, los chips actuales, los móviles o los modelos de lenguaje, Shannon ayudó a formular una idea que hoy parece obvia pero que en su momento fue extraordinaria: la información podía medirse, comprimirse, transmitirse y analizarse matemáticamente.

Claude Shannon, el hombre que puso números a la información

En 1937, con solo 21 años, Shannon presentó en el MIT una tesis de máster que se ha convertido en una de las más citadas de la historia de la computación. En A Symbolic Analysis of Relay and Switching Circuits, demostró que el álgebra de Boole podía aplicarse al diseño de circuitos eléctricos con relés. Dicho de forma sencilla: los circuitos podían representar operaciones lógicas mediante estados de encendido y apagado.

No inventó él solo toda la electrónica digital, pero sí dio una base matemática decisiva para el diseño de circuitos lógicos. Esa relación entre unos, ceros, interruptores y operaciones booleanas está en la raíz de los ordenadores modernos. Buena parte de lo que hoy llamamos computación digital desciende, de una forma u otra, de aquella intuición.

Después llegó Bell Labs, uno de los lugares más fértiles de la historia tecnológica. Allí se desarrollaron avances como el transistor, Unix, el lenguaje C y múltiples tecnologías que dieron forma a las telecomunicaciones modernas. Shannon encajaba bien en ese entorno raro, exigente y creativo. Era un investigador capaz de moverse entre matemáticas, ingeniería, criptografía, juegos mecánicos y experimentos aparentemente excéntricos.

Su gran salto llegó en 1948 con A Mathematical Theory of Communication, el artículo que fundó la teoría de la información. Shannon definió un marco matemático para medir la incertidumbre, la entropía y la cantidad de información necesaria para transmitir un mensaje. En ese trabajo aparece también el bit como unidad de información, aunque el propio Shannon atribuyó el término a John W. Tukey.

El impacto de aquel artículo fue enorme. Sin teoría de la información no se entiende bien la compresión de datos, la transmisión eficiente de señales, la corrección de errores, las telecomunicaciones modernas ni buena parte de la informática posterior. Shannon no estaba pensando en ChatGPT, Claude o los grandes modelos de lenguaje, pero sí estaba trabajando sobre una pregunta que sigue viva: cuánto puede predecirse de un mensaje a partir de lo que ya sabemos.

El juego de adivinar la siguiente letra

La conexión con los modelos de lenguaje modernos aparece con más claridad en otro trabajo de Shannon, Prediction and Entropy of Printed English, publicado en 1951. En él exploró la entropía del inglés escrito mediante experimentos de predicción de letras. El método era casi doméstico: una persona veía parte de un texto y trataba de adivinar cuál sería el siguiente carácter.

Ese experimento se ha vuelto muy citado en la era de los LLM porque recuerda, con todas las distancias necesarias, a la lógica de predicción que hay detrás de muchos modelos actuales. Un modelo de lenguaje moderno trabaja con tokens, enormes cantidades de datos, redes neuronales y arquitecturas muy sofisticadas. Shannon trabajaba con papel, probabilidades, textos impresos y personas intentando anticipar letras. La intuición de fondo, sin embargo, resulta familiar: el lenguaje tiene estructura estadística y esa estructura permite estimar lo que puede venir después.

Hay que evitar una exageración: Shannon no inventó los LLM. No diseñó transformers, ni redes neuronales profundas, ni sistemas generativos como los actuales. Pero sí formuló parte del vocabulario intelectual que hizo posible pensar el lenguaje como una fuente de información con regularidades medibles. Por eso la conexión entre Claude y Claude Shannon resulta tan atractiva.

Si Anthropic eligió el nombre como homenaje, el guiño es bastante elegante. Claude no sería solo un nombre humano y amable para un chatbot. Sería una referencia al científico que convirtió la comunicación en matemáticas y que mostró que la incertidumbre de un mensaje podía medirse con rigor.

Haiku, Sonnet y Opus: una familia con nombres literarios

La elección de “Claude” encaja además con otra decisión de marca de Anthropic: los nombres de sus modelos. La familia Claude 3 se presentó con tres variantes en orden ascendente de capacidad: Haiku, Sonnet y Opus. El patrón es claro y tiene una coherencia poco habitual en un sector lleno de nombres técnicos, siglas y numeraciones frías.

Haiku remite al poema breve japonés, condensado y preciso. En la familia de Anthropic representa el modelo más ligero y rápido. Sonnet alude al soneto, una forma poética más elaborada y estructurada, y se asocia al modelo intermedio. Opus significa obra, composición o trabajo de mayor entidad, y queda reservado para la versión más capaz de la familia.

Esa lógica literaria ha llevado a algunas personas a pensar que Claude podría estar relacionado con Claude Debussy, compositor francés asociado al impresionismo musical. La asociación no es absurda desde fuera: Sonnet y Opus tienen resonancias artísticas, y un nombre como Claude también puede recordar a un creador europeo. Pero la conexión con Shannon es mucho más fuerte cuando se mira desde la historia de la Inteligencia Artificial, la computación y la teoría de la información.

La confusión es comprensible porque los nombres de producto rara vez vienen con una nota a pie de página. Anthropic ha jugado con un tono más humanista que otros laboratorios de Inteligencia Artificial. “Claude” suena menos industrial que una sigla y los nombres Haiku, Sonnet y Opus refuerzan esa estética literaria. Pero bajo esa capa de sensibilidad cultural hay una lectura técnica muy potente: un modelo de lenguaje llamado como el hombre que ayudó a explicar matemáticamente el lenguaje, la comunicación y la incertidumbre.

El caso es útil también para entender cómo se construyen los relatos alrededor de la Inteligencia Artificial. Un buen nombre no solo identifica un producto. También sugiere una genealogía. En el caso de Claude, esa genealogía probable va de Shannon a Bell Labs, de la teoría de la información al procesamiento del lenguaje, y de los experimentos con letras impresas a los modelos que hoy predicen tokens a una escala difícil de imaginar en 1951.

Anthropic no necesita confirmarlo con una campaña publicitaria para que la referencia funcione. La comunidad ya ha hecho la lectura. Y esa lectura, aunque deba formularse como hipótesis, tiene valor divulgativo: permite explicar que los LLM no nacen de la nada. Están conectados con casi un siglo de matemáticas, ingeniería, lingüística computacional y teoría de la comunicación.

Quizá por eso “Claude” es un nombre más interesante de lo que parece. No solo da personalidad a una interfaz conversacional. También recuerda que la Inteligencia Artificial generativa no empezó con una demo viral, sino con preguntas mucho más antiguas sobre qué es la información, cómo se mide la incertidumbre y por qué el lenguaje humano puede predecirse sin dejar de sorprendernos.

Preguntas frecuentes

¿Anthropic ha confirmado que Claude se llama así por Claude Shannon?

No hay una gran explicación oficial de Anthropic ampliamente documentada sobre el origen del nombre. La atribución a Claude Shannon es la hipótesis más repetida y la que mejor encaja con la historia de la teoría de la información y los modelos de lenguaje.

¿Quién fue Claude Shannon?

Claude Shannon fue un matemático e ingeniero estadounidense considerado el fundador de la teoría de la información. Su trabajo fue decisivo para la computación digital, las telecomunicaciones, la compresión de datos y el estudio matemático de la comunicación.

¿Claude Shannon inventó los modelos de lenguaje?

No. Shannon no inventó los grandes modelos de lenguaje actuales. Pero sus trabajos sobre entropía, predicción del inglés escrito y teoría de la comunicación anticiparon ideas fundamentales sobre la estructura estadística del lenguaje.

¿Qué significan Haiku, Sonnet y Opus en los modelos de Anthropic?

Son nombres literarios usados por Anthropic para diferenciar modelos de Claude según capacidad y coste. Haiku se asocia al modelo más ligero, Sonnet al intermedio y Opus al más avanzado dentro de esa familia.