TRES

El semáforo se enciende.

Piloto de Fórmula 1. Manos aferradas al volante. Pupilas dilatadas.

1200 caballos rugiendo bajo su asiento. Combustible a punto de detonar. Cada cilindro, una bomba controlada. Cada explosión, un paso más hacia la victoria.

DOS

Cabo Cañaveral. Ground Control to major Tom. Cohete Falcon Heavy.

27 motores y 2 millones de kilos de empuje. Combustible hirviendo en sus entrañas. Ingenieros que contienen la respiración.

La cuenta atrás marca el momento exacto en que el fuego desatará su furia calculada contra la gravedad.

UNO

Boda de tu amiga. Tu amiga, tú y dos puros.

Sacas tu Zippo mientras los invitados bailan la conga de Jalisco (ahí viene arrollando) y tú das gracias por estar lejos.

Primero enciendes el puro de tu amiga. La novia siempre primero.

Un giro de pulgar y la rueda raspa contra la piedra. Chispas microscópicas buscan el combustible para prender fuego. Cientos de miles de años de evolución en la palma de tu mano.

IGNICIÓN.

Y de repente aparece un notas (no atómico) gritando: «¡CUIDADOOOOO! ¡QUE LA GASOLINA VA A PRENDER! ¡NO LO HAGÁIS!».

El ingeniero de pista se gira lentamente. El ingeniero espacial se gira lentamente. Tú arqueas la ceja como pensando: «¿Quién coño es este idiota y por qué grita?».

Los tres, separados por miles de kilómetros unos de otros, decís al unísono: —Claro. Esa es LITERALMENTE la idea. Si la gasolina no prendiera… ¿para qué hostias la querríamos?

Algo así es lo que me pasa a mí cada vez que oigo algo del estilo… «blablabla pero la IA alucina mazo blablabla».

¿Cómo que «PERO la IA alucina mazo»?

La IA alucina porque es para lo que está diseñada.

🔥 Igual que la gasolina arde.
🧨 Igual que la dinamita explota.
🦜 Igual que un militante político repite como un papagayo las consignas políticas que le ordenan.

Y de eso venía a hablarte hoy.

–¿Y Cialdini?

Cialdini tendrá que esperar.

–Pero yo quería seguir leyendo sobre cómo manipular a la gente

Pues afíliate a un partido político, qué quieres que te diga.

Yo hoy vengo a hablarte de LLMs y alucinaciones.

Hoy y posiblemente los siguientes correos.

Es lo que hay. Tengo muchos frentes abiertos y el día tiene 24 horas y la semana 7 días.

Así que lo mejor es intentar concentrar estos frentes.

Como un buen caldo.

Todo lo que voy a contarte a continuación estará simplificado. Habrá metáforas que no serán del todo correctas. Puede incluso que sean una puta mierda de metáforas. A estas alturas esto tampoco debería sorprenderte.

PERO.

Si no sabes cómo funciona la IA, mi objetivo es que te lleves una idea más o menos clara de cómo funciona y que le quites cualquier halo de misticismo que creas que tiene.

Ya sabes, lo de la tercera ley de Clarke y tal…

Cualquier técnica suficientemente sofisticada es indistinguible de la magia.

Arthur C. Clarke

Y si ya sabes cómo funciona la IA, pues podrás vanagloriarte de que lo que digo no es estrictamente cierto justo antes de darte de baja al final del correo. Donde siempre, ya sabes.

Y ahora que ya me he puesto la tirita…

Al lío.

Pero antes… una pequeña mierda de glosario.

Una pequeña mierda de glosario

Inteligencia artificial: Paso palabra. No sé definir qué significa inteligencia, como para definir inteligencia artificial.

–Hostias, notas atómico. ¿No sabes qué es inteligencia y vas a hablar de inteligencia artificial?

Correcto.

Y además estoy seguro de que tú tampoco eres capaz de definirla. La RAE tiene 8 acepciones diferentes. Así que muy claro igual tampoco está.

A partir de ahora haremos como si…

…yo supiera qué es la inteligencia…
…tú supieras qué es la inteligencia…
…ambos compartiéramos la misma definición de qué es inteligencia…
…y las máquinas pudieran comportarse como si fueran inteligentes.

A ver, hay gente que cree que sus líderes políticos buscan lo mejor para la sociedad… esto necesita de mucha menos fe.

LLM: Significa Large Language Model. Gran modelo de lenguaje. Y básicamente es lo que hay detrás de ChatGPT. Y de Google Gemini. Y de Claude. Y de…

Mira, hay muchos. Entiendo que si has estado en la Tierra en los últimos 3 años y medio, has oído hablar de ChatGPT.

Pues el motor de ChatGPT es un LLM. Es un tipo de Inteligencia Artificial especializada en el lenguaje.

Cuando diga IA me estaré refiriendo a los LLMs (todo sea por ahorrarnos una letra).

Alucinación: Es como llamamos los humanos a las equivocaciones de una IA.

Es como el CIS de Tezanos pero sin querer.

La única cosa que hacen los LLMs

Hay una cosa que tienes que tener clara.

Los LLMs hacen una sola cosa.

Sólo una.

Una y nada más.

Voy a insistir una vez más por si no ha quedado suficientemente claro.

LOS LLMs SÓLO HACEN UNA PUTA COSA

Predecir la siguiente palabra.

–No predice palabras. Predice tokens.

–Ni pridici pilibris. Pridici tikins. Mimimimi

Sí, predice tokens, pero eso a ti y a mí nos da igual. Tú, ni puto caso al friki.

En esencia, lo que hacen estos sistemas es que les das una frase y ellos le añaden una palabra.

Y luego cogen esa nueva frase y le añaden otra más.

Y luego otra.

Y otra.

Y así, hasta que “deciden” que ha llegado al final.

Por ejemplo, si le pasamos a un LLM la frase: “El notas atómico”, lo normal es que el LLM devuelva sucesivamente:

El notas atómico es
El notas atómico es tremendamente
El notas atómico es tremendamente atractivo
El notas atómico es tremendamente atractivo [FIN]

¿Pillas la idea, no?

Tú le pasas una frase inicial, y el LLM predice la siguiente palabra.

–¿Y eso es todo?

Eso es todo.

– ¿En serio?

En serio.

Un LLM es básicamente un proceso estadístico sofisticado que, a partir de una secuencia de palabras, genera la siguiente palabra más probable.

Es decir, que los LLMs siempre inventan.

Como en Ferrari.

Y NO HAY MÁS.

Lo que pasa es que estos sistemas predicen TAN bien la siguiente palabra que aciertan casi siempre.

Y que las veces que no aciertan son tan tremendamente convincentes que te la cuelan…

…si no sabes del tema que está hablando.

Pasa lo mismo con un tertuliano o con tu cuñado.

No pasa, en cambio, con un militante.

Los militantes se inventan todo, no aciertan casi nunca y no convencen prácticamente a nadie.

El cuñado estocástico que se ha leído TODO puto internet

Vamos a ver. Te cuento cómo funciona esto por debajo.

Más o menos.

En realidad estos sistemas no van al diccionario y escogen una palabra al azar.

Eso sería poco útil y tremendamente barato.

Los LLMs escogen la siguiente palabra en base a una serie de probabilidades.

¿Cómo? Pues imagínatelo como un dado.

Por ejemplo, si a un LLM le pones: “La capital de España es”

El LLM tira un dado de 100 caras.

Si sale del 1 al 99, dice “Madrid”.

Si sale 100, dice “Barcelona”.

Para que saliera Teruel, haría falta tirar 100 veces un dado de 1.000.000 de caras y que en todas saliera 1.

Teruel existe.

Pero poco.

Es decir que calculan las probabilidades de cada posible palabra y eligen una entre las más probables.

Y cada vez que generan una palabra, vuelven a tirar el dado para la siguiente.

¿Y por qué aciertan tanto?

Porque sus datos de entrenamiento son LA HOSTIA DE GRANDES.

Estos modelos han aprendido “leyendo” TODO internet.

Cuando han visto “La capital de España es” seguido de “Madrid” MILES DE MILLONES DE VECES, pues es más probable que respondan Madrid cuando les haces esa pregunta.

A ver, que esto está simplificado y es algo más complicado. Pero creo que te haces una idea.

OJO CUIDAO.

Porque esto significa que todos los sesgos que hayan visto durante su entrenamiento, los van a incorporar a su “conocimiento”.

Esto da para otro mail.

Incluso para muchos.

Pero hoy estamos a setas, no a Rolex.

Alucina vecina

Total, que estos bichos SIEMPRE INVENTAN.

Pero aciertan casi siempre.

Y “casi siempre” implica, a la fuerza, que hay veces que no.

Aunque lo parezca.

Hay veces que le pides que te haga una defensa para un juicio, se inventa jurisprudencia, tú no lo revisas y acabas teniendo que pagar $5000 y da gracias porque podrías haber acabado en la cárcel.

True story.

Aquí es cuando decimos que la IA ha alucinado.

Como si esto fuera un fallo del sistema.

Cuando la realidad es que el que se ha flipado ha sido el abogado de turno, no la IA.

Porque, por lo que sea, pensamos que la IA NO debería alucinar.

Y aquí es donde yo niego la mayor.

Que la IA alucine no es un fallo. Que la IA alucine es la mayor y mejor feature que puede tener.

Espera que lo voy a escribir bien grande y a color (si tu lector de correo me deja) para que quede bien clarito.

QUE UN LLM ALUCINE ES DE PUTA MADRE

Porque esta Inteligencia Artificial va de generar cosas.

Y no todo lo que se crea tiene que ser factualmente correcto.

¿Acaso no me viene bien que la IA me ayude a crear un mundo de fantasía y crear un cuento donde mi hija sea la protagonista?

¿Acaso no me viene bien que la IA me ayude a crear un relato sobre cómo se siente una IA cuando le preguntamos gilipolleces?

¿Acaso no viene bien para escribir discursos motivacionales de mierda como éste?

Así que no.

Que una IA alucine NO es un problema de la IA.

Que una IA alucine NO la hace necesariamente peor que otra que no lo haga.

Que una IA alucine será un problema o no dependiendo del contexto en el que estés y lo que quieras hacer.

Si quieres que te haga un análisis de la competencia NO quieres que alucine.
Si quieres que te haga un resumen financiero del año NO quieres que alucine.
Si quieres que te haga un diagnóstico médico DEFINITIVAMENTE NO quieres que alucine.

En estos casos, que una IA alucine será un problema TUYO, que tendrás que gestionar TÚ, minimizando estas alucinaciones.

De la misma manera que no quieres que la gasolina de un Zippo explote.

¿Pero y si quieres que te ayude a hacer un plan de estrategia?
¿Y si quieres que te ayude a escribir el discurso de la boda de tu amiga a la que le gusta fumar puros?
¿Y si quieres que te ayude a descubrir relaciones entre diferentes estudios?

En estos casos, lo más probable es que quieras que alucine aunque sea un poquito. En unas más y en otras menos.

Igual que te viene bien que la gasolina combustione y explote de forma controlada dentro del motor de tu coche.

Que se invente un nuevo plan de marketing original que nunca ha visto, que se invente un discurso gracioso y emotivo que nunca has leído; o que conecte conceptos nunca antes conectados, son todo fruto de cierto grado de alucinación.

En el fondo todos estos casos son alucinaciones CONVINCENTES.

Y en el fondo esto es lo mismo que haríamos nosotros en esas situaciones.

Dejaríamos volar nuestra imaginación, empezaríamos “a probar” ideas y dejaríamos que la serendipia hiciera su trabajo.

Total, que esto no va de eliminar las alucinaciones de una IA, sino de intentar controlar el grado de alucinación de las mismas que necesitemos para resolver una tarea.

Si la tarea en cuestión es responder un hecho concreto, hacer un resumen, inventarse un chiste o pedirle que te explique un concepto que no entiendes, necesitarás modular las alucinaciones del modelo.

Y para esto hay técnicas.

Pero esto lo veremos en siguientes correos, que por hoy ya está bien.

Un abrazo, El Notas Atómico ⚛️

Las alucinaciones de los LLMs son una feature, no un bug

Los LLMs siempre inventan. Y esto debería considerarse una feature porque es para lo que están diseñados.

El reto está en conseguir el grado de alucinación necesario para la tarea que queremos resolver.

PD: Esto de que las alucinaciones son una feature no es una idea mía. Es de Andrej Karpathy. Y yo se la he comprado.

PD2: Es difícil saber en qué nivel de abstracción situarse al hablar de temas técnicos. Demasiado rigor y esto no te lo fumas ni con 20 barriles de Brent, por lo que he decidido que, ante la duda, mejor pecar de simplista.

PD3: Si hay algo que no te ha quedado claro, escríbeme y te contesto. Este correo tiene garantía de por vida. El único requisito es que estés suscrito/a a la lista de correo.

PD4: Envía este correo a quien creas que le pueda interesar.

PD5: Si te han reenviado este correo y te apetece saber más sobre cosas es aquí: https://notas-atomicas.com.

PD6: ¿Que qué cosas? No sé. Cosas. Como éstas.

PD7: Alucina, vecina