Tipos de memoria. Una palabra para cinco cosas distintas

Cuando alguien dice que se acuerda de su primer beso, que sabe la capital de Mongolia, que toca el piano sin pensarlo, que no se olvida de quién es después de dormir, y que mantiene un número de teléfono en la cabeza durante los seis segundos que tarda en marcarlo, está describiendo cinco cosas distintas. No metáforas distintas de una misma facultad. Cinco sistemas neuronales con sustratos diferentes, curvas de olvido diferentes, patologías diferentes y modos de entrenamiento diferentes. El idioma castellano los llama a todos memoria. Se equivoca, y la equivocación tendría poca importancia si no fuera porque hay una industria entera que vive ahora mismo de venderte uno solo de esos cinco sistemas, mal hecho, con la etiqueta genérica.

El día que Tulving partió la palabra en dos

Empecemos por el catálogo, que viene de bastante atrás. Endel Tulving publicó en 1972 un capítulo en Organization of Memory en el que separaba dos cosas que hasta entonces se mezclaban con alegría: la memoria de los hechos del mundo y la memoria de los hechos de tu vida. Saber que Lisboa es la capital de Portugal y recordar el día en que estuviste en Lisboa son operaciones distintas.

La primera la llamó semántica: contenido abstracto, sin coordenadas temporales, sin sensación de haber estado allí. Es lo que está en una enciclopedia, lo que está en tu cabeza después de un examen, lo que tienes cuando puedes definir una palabra. La segunda la llamó episódica: el recuerdo de un evento concreto, con su cuándo, su dónde, su olor a calle empinada, y sobre todo con la conciencia de haber sido tú quien estaba allí.

Tulving añadió que la episódica viene acompañada de un tipo particular de conciencia — la autonoética (la que se reconoce a sí misma en el pasado) — que no aparece cuando recuperas un dato semántico. Saber que pasó algo y recordar haberlo vivido son experiencias mentales distintas. Lo notas inmediatamente cuando un amigo te cuenta una historia tuya que tú habías olvidado: hasta que no la recuperas como propia, es una anécdota ajena.

Lo que el cuerpo sabe sin contártelo

Trece años después, en 1985, Tulving amplió el cuadro con un tercer sistema: la memoria procedimental. Es la del cuerpo. La del pianista que ha dejado de pensar en los dedos, la del nadador que entra en el agua y la del hablante nativo que conjuga sin acordarse de la regla. Se construye con repetición motora, se almacena en circuitos cerebelosos y de los ganglios basales, y resiste mucho mejor que las otras al deterioro neurológico.

Un paciente con amnesia profunda puede no recordar lo que comió hace una hora y seguir tocando el piano correctamente. Lo curioso es que la procedimental no es accesible al lenguaje: si pides a un pianista veterano que te explique exactamente qué hace su mano izquierda en el compás 14, no podrá. Si lo intenta, además, se equivocará. Hay un saber que no pasa por la conciencia, y que se estropea cuando se le obliga a pasar por ella. Kandel dedicó toda una vida en In Search of Memory a perseguir esa frontera celular: lo que hace que un sinapsis se vuelva habilidad y no recuerdo, lo que cambia en la maquinaria molecular cuando una mano se ha ejercitado lo suficiente.

La pizarra de siete segundos

Mientras Tulving organizaba este catálogo en Toronto, Alan Baddeley y Graham Hitch publicaban en 1974 un modelo distinto pero compatible: la memoria de trabajo. No la confundas con la memoria a corto plazo de los manuales viejos, aunque la nomenclatura se haya cruzado mil veces.

La memoria de trabajo es una pizarra activa, no un almacén. Mantiene información mientras haces algo con ella. Tiene capacidad ridícula — del orden de unos siete elementos, menos si los elementos son complejos — y una duración de unos pocos segundos si no la refrescas. Es lo que usas para multiplicar dos números de dos cifras sin papel, lo que usas para sostener el principio de una frase larga hasta que llega el verbo, lo que se desborda cuando alguien te dicta una dirección entera de una sola tirada.

El modelo de Baddeley distinguía un bucle fonológico, una agenda visoespacial y un ejecutivo central que reparte recursos entre ambos. Es ingeniería cognitiva, no metáfora.

El relato que sostiene al que se llama yo

Daniel Schacter añadió luego una quinta categoría, la autobiográfica, que algunos autores integran dentro de la episódica y otros mantienen aparte por una razón importante: la autobiográfica no es un montón de episodios sueltos. Es la narrativa continua del yo.

Es el relato que te cuentas sobre quién eres, de dónde vienes, qué te pasó cuando tenías nueve años, en qué te ha convertido eso. No es la suma de los episodios; es la edición. Tiene huecos, tiene fabricaciones, tiene reescrituras constantes — la narrativa de los cuarenta no coincide con la de los veinte aunque los hechos sean los mismos —, y tiene un papel central en sostener la identidad.

Damasio la sitúa en el sustrato mismo de la conciencia extendida: sin biografía, no hay un yo que se reconozca en el tiempo. Hay un organismo, hay reacciones, hay incluso un protoyó, pero no hay alguien que diga «yo».

Cinco modos de entrenarse, cinco modos de fallar

Cinco sistemas, entonces. De trabajo, episódica, semántica, procedimental, autobiográfica. Cada uno se entrena distinto.

La semántica con estudio, repaso, repetición espaciada. La procedimental con horas de práctica motora. La de trabajo apenas se entrena: tiene un techo casi fijo en cada individuo. La episódica se consolida sola durante el sueño, especialmente en las fases de ondas lentas. La autobiográfica se construye narrando, y se pierde cuando se deja de narrar — los ancianos que dejan de hablar de su vida no pierden los hechos, pierden el hilo.

Cada uno falla distinto, también. El Alzheimer arrasa primero la episódica reciente, deja durante años la semántica, conserva mucho tiempo la procedimental. La afasia destruye la semántica del lenguaje sin tocar la procedimental motora. Una conmoción cerebral puede borrar las últimas horas de episódica sin alterar nada más. Y cada uno decae distinto en el envejecimiento normal: la de trabajo empeora rápido, la procedimental se mantiene asombrosamente, la semántica incluso crece hasta entrada la vejez. Squire resumió en 2009, en Memory and Brain Systems, cuarenta años de neuropsicología de la lesión: la disociación entre sistemas no es teoría, es lo que se ve cuando se compara un cerebro dañado con otro. Cada sustrato tiene su patología, y eso es la prueba más limpia de que no se trata de una sola facultad con varios disfraces.

La pregunta que está pagando salarios

Ahora, sobre esto, plantéate la pregunta que está pagando salarios en Silicon Valley. ¿Tiene memoria un LLM (gran modelo de lenguaje, large language model, los sistemas tipo ChatGPT)?

Lo que tiene un LLM por defecto es una ventana de contexto (el trozo de texto que el modelo puede leer en un mismo turno). Es un buffer (espacio temporal de retención) en el que entra el texto reciente de la conversación y desde el cual el modelo calcula la siguiente palabra. Funcionalmente, se parece a la memoria de trabajo: capacidad limitada, contenido activo, se borra al cerrar la sesión.

Si encajas el modelo con el catálogo de cinco, la ventana de contexto es trabajo. Trabajo enorme — cientos de miles de unidades en algunos modelos —, pero trabajo. Nada más. Cuando cierras la pestaña, la pizarra se borra. La siguiente conversación empieza desde cero, exactamente como un paciente con amnesia anterógrada (incapacidad de fijar recuerdos nuevos tras la lesión).

Pesos congelados, semántica fosilizada

Lo que el modelo tiene además, aunque la palabra «memoria» se use también para esto, son los pesos: los miles de millones de parámetros numéricos congelados durante el entrenamiento. Eso es, si quieres, una memoria semántica fosilizada. Contiene patrones del lenguaje, asociaciones estadísticas entre conceptos, hechos del mundo aprendidos por exposición masiva.

No es exactamente semántica humana — no está organizada en redes conceptuales, no admite metacognición sobre lo que sabe o no sabe —, pero cumple un papel parecido cuando le preguntas la capital de Mongolia. La diferencia importante es que los pesos no se actualizan durante la conversación. El modelo no aprende de ti. El modelo te responde con lo que ya sabía antes de que existieras.

El parche que se vende como recuerdo

Para parchear este hueco, la industria inventó hace unos años el RAG (retrieval-augmented generation, generación aumentada por recuperación de documentos externos). Lewis y otros lo formalizaron en NeurIPS 2020.

Es una técnica útil: pones documentos en un almacén externo, los conviertes en vectores numéricos, y cuando el modelo recibe una pregunta busca en ese almacén lo más parecido y lo mete en la ventana de contexto antes de responder. Esto le permite «recordar» cosas que no estaban en su entrenamiento original, incluyendo conversaciones anteriores tuyas si las has guardado.

Algunos productos comerciales empaquetan esto y lo llaman directamente «memoria». Lo es, en un sentido pobre. Es semántica externa indexada por similitud. No es episódica. No tiene marca temporal, no tiene sensación de haber sido vivida, no se reconstruye contextualmente. Es una consulta a una base de datos disfrazada con la palabra de la psicología cognitiva que mejor vende.

Lo que un modelo no tiene y no puede tener

Lo procedimental, en un LLM, sencillamente no existe. No hay un sistema motor que se entrene con horas de práctica. Lo único parecido es el fine-tuning (reajuste fino de los pesos del modelo a partir de ejemplos adicionales), y eso ocurre fuera de la conversación, por decisión del fabricante, no del usuario.

Tampoco hay autobiográfica, y aquí está la frontera dura. Un modelo no tiene una vida. No hay un hilo continuo desde su «infancia» — no tiene infancia — hasta este momento. No hay una narrativa de sí mismo que sostenga su identidad entre sesiones.

Cuando un usuario le pide al modelo que cuente su historia, el modelo improvisa una a partir de los patrones de autobiografía humana que ingirió. Es una autobiografía ficcional generada al vuelo. Si le preguntas mañana, te contará otra, salvo que se la haya escrito alguien y la haya guardado en el RAG. Y aun así, lo guardado en el RAG sería el relato, no la vivencia. Como pedirle a un actor que recite un diario ajeno.

Falta también, y esto es lo más interesante para lo que viene, la conciencia autonoética. La de Tulving. La de saberse en el pasado. Cuando recuperas un recuerdo episódico, no recuperas solo un contenido; recuperas la sensación de haber sido tú quien estaba allí. Un LLM no tiene nada parecido porque no tiene un yo persistente al que vincular el contenido. Tiene un texto en una ventana, y unos pesos congelados, y opcionalmente una base vectorial. No hay sujeto. No hay nadie que se reconozca.

El truco está en la palabra

Cuenta entonces qué pasa cuando un comercial te dice que su producto «recuerda» tus conversaciones. La frase está construida para que tu cerebro la procese con la palabra completa. La memoria, sin más, la de los cinco sistemas integrados, la que sostiene tu vida.

Lo que el producto hace en realidad es guardar fragmentos de texto en un almacén, vectorizarlos, y reinyectarlos en la ventana de contexto cuando algún algoritmo de similitud los considere relevantes. La diferencia entre lo que la palabra sugiere y lo que el sistema hace es enorme, y la palabra está elegida para que esa diferencia se note lo menos posible.

No es accidente lingüístico. Es ahorro de explicación y desplazamiento de responsabilidad. Si el sistema se «olvida» de algo importante, el usuario lo lee como un fallo menor de memoria, no como lo que es: una limitación arquitectónica del producto que se compró creyendo que compraba otra cosa.

Bender y otros lo señalaron en Stochastic Parrots en 2021, aunque con menos saña de la que el tema merecía. La importación de vocabulario cognitivo humano al describir LLMs no es neutra. «Memoria», «entender», «razonar», «alucinar» — todas son palabras que activan en el oyente un modelo mental de la mente humana y proyectan ese modelo sobre el sistema artificial. Cada vez que la industria usa una de estas palabras está cobrando, gratis, la expectativa que la palabra carga en el lenguaje natural. Y cada vez que la usa sin matizar, está disimulando una diferencia ontológica con un sinónimo cómodo.

La próxima vez que te lo digan

Lo más sano que puedes hacer la próxima vez que oigas «esta IA recuerda» es preguntar cuál de las cinco. Trabajo. Semántica. Episódica. Procedimental. Autobiográfica.

La respuesta técnica es: la primera, parcialmente, y la segunda en forma congelada y no actualizable. Las otras tres no las tiene, no las ha tenido nunca, y por arquitectura actual no las puede tener.

Si quien te vende el producto contesta «todas», sabes ya con quién estás hablando. Si contesta «ninguna del todo», sabes también, y probablemente puedas fiarte un poco más de las demás cosas que diga.

La palabra es la misma. Las cosas que nombra, no.

Definiciones

Memoria episódica. Sistema que almacena recuerdos de eventos concretos vividos por el sujeto, con coordenadas de tiempo y lugar, acompañados de la sensación de haber estado uno mismo allí.

Memoria semántica. Sistema de conocimiento abstracto sobre el mundo, sin referencia al momento ni al lugar en que se aprendió. La capital de un país, el significado de una palabra, las reglas de un juego.

Memoria procedimental. Sistema motor implícito que almacena destrezas corporales adquiridas por repetición. Tocar un instrumento, nadar, escribir a máquina. No pasa por la conciencia y se deteriora si se intenta verbalizar.

Memoria de trabajo. Pizarra mental activa de capacidad muy limitada (unos siete elementos, segundos de duración) en la que se manipula información mientras se ejecuta una tarea cognitiva.

Memoria autobiográfica. Narrativa continua y editada del yo, construida a partir de episodios pero no reducible a ellos. Sostiene la identidad personal en el tiempo.

Conciencia autonoética. Tipo de conciencia, descrita por Tulving, que acompaña a la recuperación de un recuerdo episódico y consiste en reconocerse a uno mismo como sujeto del evento recordado.

Amnesia anterógrada. Incapacidad para fijar recuerdos nuevos a partir del momento de una lesión cerebral, aunque la memoria previa permanezca intacta.

LLM (large language model, gran modelo de lenguaje). Modelo estadístico de gran tamaño entrenado sobre enormes cantidades de texto que predice la siguiente palabra a partir de un contexto dado. Los sistemas conversacionales tipo ChatGPT son su implementación más conocida.

Ventana de contexto. Cantidad máxima de texto que un LLM puede tener simultáneamente presente al generar una respuesta. Se mide en unidades llamadas tokens (trozos de palabra). Se borra al terminar la sesión.

Pesos del modelo. Los miles de millones de parámetros numéricos que un LLM aprende durante su entrenamiento y que quedan congelados al desplegarlo. Codifican estadísticamente lo que el modelo «sabe».

RAG (retrieval-augmented generation). Técnica que añade al LLM un almacén externo de documentos vectorizados; ante una pregunta, se buscan los fragmentos más similares y se inyectan en la ventana de contexto antes de generar la respuesta.

Fine-tuning. Reajuste de un subconjunto de los pesos del modelo a partir de ejemplos adicionales, habitualmente para especializarlo en un dominio o tarea. Ocurre fuera de las conversaciones, en una fase de entrenamiento aparte.

Referencias

Tulving, Endel (1972). Episodic and Semantic Memory. Capítulo en Organization of Memory (Academic Press). Es la obra en la que se introduce la distinción canónica entre memoria episódica y semántica, eje del catálogo que vertebra este artículo.

Tulving, Endel (1985). How Many Memory Systems Are There? American Psychologist 40, pp. 385–398. Amplía el cuadro previo añadiendo la memoria procedimental y formulando la noción de conciencia autonoética asociada a la episódica.

Baddeley, Alan & Hitch, Graham (1974). Working Memory. En The Psychology of Learning and Motivation, vol. 8 (Academic Press). Formulación original del modelo de memoria de trabajo con bucle fonológico, agenda visoespacial y ejecutivo central.

Schacter, Daniel L. (2001). The Seven Sins of Memory (Houghton Mifflin). Aporta la taxonomía operativa que incluye la memoria autobiográfica como sistema diferenciable y describe los modos típicos de fallo de cada uno.

Squire, Larry R. (2009). Memory and Brain Systems: 1969–2009. Journal of Neuroscience 29, pp. 12711–12716. Síntesis neural de los sistemas múltiples; soporte para las afirmaciones sobre sustratos diferenciados y patrones de daño selectivo.

Damasio, Antonio (1999). The Feeling of What Happens (Harcourt). Fuente de la tesis de que la memoria autobiográfica es sustrato de la conciencia extendida y, sin ella, no hay un yo que se reconozca en el tiempo.

Kandel, Eric (2006). In Search of Memory (Norton). Trasfondo neurocientífico general sobre la consolidación y los sustratos celulares de los distintos sistemas mnésicos.

Lewis, Patrick; Perez, Ethan y otros (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS 2020. Formalización original del RAG, técnica citada en el artículo como parche industrial al problema de la persistencia en los LLM.

Bender, Emily M. y otros (2021). On the Dangers of Stochastic Parrots. FAccT 2021. Referencia para la crítica al uso comercial del vocabulario cognitivo humano (memoria, entender, razonar) aplicado a modelos de lenguaje.

También te interesa

En otros sitios

#memoria-ia #antropomorfismo #inteligencia #papers