El cerebro como sistema no determinista. El ruido era nuestro, no suyo

Coge a una persona, ponla dos veces en la misma situación al microsegundo, y observa. La intuición dice que no hará lo mismo. La neurociencia, con datos, también dice que no. Y aún así la justicia, la educación y media psicología clínica siguen funcionando como si sí. La IA actual, en cambio, es determinista de manual con un pellizco de aleatoriedad cosmética encima. La paradoja es entretenida hasta que uno cae en cuál de los dos errores le toca a cuál.

El ruido no es un fallo, es el material

Empecemos por abajo, donde duele menos discutir y donde la evidencia es más limpia. El sistema nervioso no es determinista. No lo es porque la maquinaria que lo compone no lo es. Las neuronas disparan espontáneamente, sin estímulo que lo justifique. La sinapsis libera neurotransmisores en cantidades variables ante el mismo potencial de acción que llega — los canales iónicos (las compuertas moleculares por las que pasan los iones que generan la señal eléctrica) se abren y se cierran con dinámica probabilística, no por reloj.

Faisal, Selen y Wolpert publicaron en 2008 en Nature Reviews Neuroscience una síntesis que se ha convertido en lugar obligado de paso: el ruido neural no es un defecto que la evolución no haya podido pulir, es una propiedad funcional del sistema. Permite explorar, generalizar, salir de óptimos locales, mantenerse plástico. Quitárselo sería romperlo.

Si mides la respuesta de una sola neurona de la corteza visual ante el mismo punto luminoso repetido cien veces, la respuesta cambia cada vez. Cambia en latencia, cambia en número de descargas, cambia en patrón temporal. No tanto como para que veas el punto en otro sitio. Pero sí lo bastante como para que la microestructura interna de tu percepción sea, cada vez, una percepción distinta. Lo que llamamos «ver lo mismo» es una abstracción que el cerebro fabrica tarde, después de haber agregado mucho.

La materia prima no es nunca la misma.

La decisión que llegó tarde

Sube un nivel. Pon al sujeto delante de una decisión libre: mover el dedo cuando quiera. Es el experimento de Libet, 1985, repetido y discutido durante cuarenta años. Se mide la actividad cerebral preparatoria — el llamado potencial de disposición (una rampa de actividad eléctrica que precede al movimiento voluntario) — y se compara con el momento en que el sujeto reporta haber decidido. La actividad preparatoria empieza unos trescientos cincuenta milisegundos antes de que el sujeto sienta que decidió. La conciencia llega tarde, comenta sobre algo que ya estaba pasando.

Wegner construyó sobre eso, en The Illusion of Conscious Will (MIT Press, 2002), la tesis de que la sensación de agencia es una reconstrucción posterior. Un comentario sobre el acto, no su causa. Maoz y colaboradores, en una replicación moderna publicada en eLife en 2019, refinaron el cuadro. Distinguieron decisiones arbitrarias y decisiones deliberadas, y mostraron que el patrón es más complejo de lo que Libet había planteado. Pero la idea de fondo no se desmonta: lo que la conciencia llama «mi decisión» es la punta visible de una cadena cuya raíz no es accesible a la introspección.

Y, conviene insistir, esa cadena no es una cadena determinista clásica. Es una cadena estocástica.

Determinismo, libre albedrío y un malentendido cómodo

Sapolsky, que no se anda con sutilezas, llevó el argumento al extremo en Determined: A Science of Life Without Free Will (Penguin, 2023): no hay un punto en la cadena causal de una decisión humana donde alojar algo así como un libre albedrío, y por tanto la categoría sobra. Dennett, en Freedom Evolves (Viking, 2003), había intentado salvar una versión compatibilista — un libre albedrío redefinido como capacidad de evaluación reflexiva en un sistema causalmente determinado. La discusión entre ambas posiciones ocupa estanterías.

Lo interesante para lo que nos ocupa aquí no es ese debate metafísico. Es una consecuencia que casi nadie subraya. Incluso si Sapolsky lleva razón y todo está determinado por la cadena causal, la cadena causal incluye ruido. La descripción física correcta del cerebro no es la del dominó newtoniano donde dado el estado A llega inevitablemente el estado B. Es una descripción estocástica (gobernada por procesos probabilísticos, donde el mismo estado inicial puede llevar a estados posteriores distintos), en la que la misma entrada produce distribuciones de salida, no salidas únicas.

Determinismo y no determinismo no son lo opuesto del libre albedrío. Son dos descripciones físicas distintas del sustrato. Lo que importa para todo lo que sigue es que la descripción real del cerebro es la segunda, y no se discute mucho en serio. Se ignora porque incomoda.

Un juzgado construido sobre arena

Aterriza esto en un tribunal. El derecho penal moderno presume que una persona, en condiciones normales, es responsable de sus actos porque podría haber actuado de otro modo. El criterio del «hombre razonable» supone una constancia: si A entra en la situación X, A produce el comportamiento Y. Si produce Z, está cometiendo una desviación atribuible a su carácter, su voluntad o su negligencia.

Sustituye la presunción por lo que sabemos.

A entra en X, y A produce un comportamiento dentro de una distribución de probabilidad determinada por su biología, su historia, su estado interno y el ruido del sistema. Mañana, en una situación equivalente, A produciría otro punto de esa misma distribución. Posiblemente muy distinto. Sin mediar ninguna decisión consciente que justifique la diferencia. ¿Sobre qué exactamente recae la responsabilidad? Si juzgamos un punto de la distribución como si fuera la distribución entera, estamos juzgando una variable como si fuera una constante.

No estoy escribiendo un alegato para abolir la responsabilidad penal. El ataque a esa noción tiene su propio coste, y es enorme: una sociedad que renuncia a imputar actos a personas se desmonta deprisa. Pero conviene no confundir el pavimento blando con el edificio sólido que aguanta encima. El derecho funciona, en gran medida, porque la sociedad necesita que funcione. No porque su modelo antropológico sea correcto.

El examen, el test, la entrevista

La educación opera con la misma ficción. Un examen presume que dos alumnos con el mismo conocimiento producirán respuestas comparables, y que un mismo alumno examinado dos veces produciría puntuaciones casi idénticas, con un margen de error pequeño atribuible al instrumento. La realidad es que la variabilidad del mismo sujeto en pruebas cognitivas — medida en estudios test-retest a intervalos cortos — es perfectamente capaz de mover una nota de sobresaliente a notable, o al revés, por razones que no tienen que ver con lo aprendido.

El alumno no es un acumulador de saber que se descarga limpio cuando se le pulsa. Es un sistema cuya disposición a recuperar un contenido depende de fluctuaciones que ni él controla ni el evaluador puede leer.

La psicología clínica trabaja con el mismo problema y lo sabe. Diagnósticos basados en cuestionarios autoaplicados cuyas respuestas cambian con el día. La selección de personal se monta sobre entrevistas y pruebas cuya fiabilidad test-retest es notoriamente pobre. Lo seguimos usando. No tenemos otra cosa. Pero conviene no confundir la herramienta con la realidad que pretende medir.

Y ahora la parte donde el ruido era nuestro, no suyo

Una red neuronal artificial en inferencia (la fase en la que el modelo, ya entrenado, genera la respuesta a una entrada) es determinista. Le metes el mismo tensor de entrada, fijas la semilla (un número que inicializa cualquier generador de aleatoriedad para que produzca siempre la misma secuencia) y las mismas operaciones de coma flotante, y te devuelve exactamente la misma salida. Bit a bit. Sin variabilidad. Es matemática aplicada, no biología.

Cuando un modelo de lenguaje grande parece producir respuestas distintas a la misma pregunta, no es porque haya ruido en el sistema. Es porque se introduce una aleatoriedad explícita en el último paso, en el muestreo. La temperatura (un parámetro entre cero e infinito que controla cuánto se «aplana» la distribución de probabilidad antes de elegir el siguiente fragmento de texto), ese mando que el usuario manipula desde fuera, no es una propiedad emergente del modelo. Es un control de la entropía con la que se elige el siguiente token — la unidad de texto, una palabra o trozo de palabra — sobre una distribución que el modelo ha calculado de forma completamente determinista.

Holtzman y colaboradores lo analizaron en The Curious Case of Neural Text Degeneration (ICLR 2020). El nucleus sampling, el top-k, el top-p son técnicas para evitar que la elección codiciosa del token más probable produzca texto degenerado o repetitivo. Son trucos de generación. La función subyacente sigue siendo la misma máquina determinista debajo.

Un dado encima de un cálculo no es un cerebro

Esa aleatoriedad superficial se parece tan poco al ruido neural como un dado de seis caras se parece al sistema solar. El ruido del cerebro está distribuido por toda la arquitectura, modula cada operación intermedia, está acoplado a la dinámica temporal del sistema, interactúa con los estados globales — atención, vigilancia, oscilaciones corticales —, y es funcional: el sistema lo usa para explorar, para escapar de óptimos locales, para generalizar, para mantenerse plástico.

El ruido de un modelo de lenguaje, en cambio, está en la última capa, es opcional, lo enciende el usuario, está descorrelacionado de todo lo demás, y no cambia nada del cálculo interno. La representación intermedia es idéntica en todos los muestreos. Pintar las dos cosas como equivalentes es como decir que tener un tic en el ojo te equipara a un sistema dinámico complejo.

La contradicción que la industria no ha resuelto

A la industria esto le pesa, aunque no lo diga. Los modelos de lenguaje producen respuestas demasiado consistentes para la sensibilidad humana, que detecta el patrón y se aburre o desconfía. Y a la vez producen respuestas demasiado inconsistentes para los usos profesionales, donde se quiere reproducibilidad bit a bit. Se pide variabilidad de conversación humana cuando hablas con el sistema. Se pide fiabilidad de máquina cuando lo integras en un proceso.

El sistema no puede dar ambas cosas, porque no las tiene en el sitio donde tendría que tenerlas. El ruido humano no es un muestreo aleatorio aplicado al final sobre una distribución limpia. Es una propiedad estructural del sistema que computa. Imitarlo añadiendo más temperatura es el error de quien copia un cuadro pintando solo la superficie y dejando el caballete intacto.

El día en que la IA se parezca a nosotros

Lo que se está pidiendo a la inteligencia artificial, con creciente insistencia, es que sea como nosotros. Que dude. Que cambie. Que explore. Que no responda dos veces igual a la misma pregunta. Suponiendo que algún día se consiga — no por subir la temperatura, sino por arquitecturas con estados internos fluctuantes, dinámica temporal acoplada y ruido funcional integrado en el sustrato del cálculo —, lo que se habrá construido no será un sistema más útil.

Será un sistema más parecido a un humano. Con todo lo que eso implica.

Menos predecible. Menos auditable. Menos controlable. Menos garantía de contrato. La industria vende «agentes» y al mismo tiempo intenta preservar la fiabilidad determinista del cálculo, y esa es una contradicción que el mercado aún no ha enfrentado de cara. Cuanto más se parezca el agente a un humano, peor se podrá meter en un contrato de servicio. Cuanto mejor se pueda meter en un contrato, menos se parecerá a un humano. No hay punto medio cómodo.

La lección no es sobre la IA

La razón de que la IA actual sea tan distinta de un humano no es solo que le falte cuerpo, o conciencia, o vida. Es que es determinista en el sustrato, y nosotros no lo somos. Nuestro no determinismo no es un defecto que la evolución no consiguió pulir. Es la condición misma de que podamos pensar como pensamos, aprender como aprendemos y decidir como decidimos.

La consistencia perfecta de una máquina nunca fue una ventaja sobre el ser humano errático. Era la marca de fábrica de algo que no está vivo.

Y todavía seguimos diseñando juzgados, aulas, departamentos de recursos humanos y manuales de psicología asumiendo lo contrario en el lado humano, mientras gastamos miles de millones en intentar que la máquina deje de portarse como una máquina. Si uno se distancia lo suficiente, hay algo cómico en la simetría. Si la mira desde dentro del juzgado, del aula o del despacho del director de personal — algo menos.

Definiciones

Ruido neural. Variabilidad espontánea de la actividad del sistema nervioso, presente en las descargas neuronales, en la liberación sináptica de neurotransmisores y en la apertura de canales iónicos. No es un fallo del sistema sino un rasgo estructural, y la neurociencia actual lo considera funcional para la exploración, la generalización y la plasticidad.

Potencial de disposición. Rampa de actividad eléctrica cerebral, registrable en el cuero cabelludo, que precede en cientos de milisegundos a un movimiento voluntario y aparece antes de que el sujeto reporte haber decidido moverse. Es el dato central del experimento de Libet.

Determinismo. Propiedad de un sistema en el que un estado inicial y unas reglas fijas conducen siempre al mismo estado posterior. Aplicado a un modelo computacional: la misma entrada produce siempre la misma salida, bit a bit, si no se introduce aleatoriedad explícita.

Sistema estocástico. Sistema gobernado por procesos probabilísticos, donde un mismo estado inicial puede dar lugar a distintos estados posteriores con cierta distribución de probabilidad. El cerebro encaja en esta descripción; un modelo de lenguaje grande, salvo en su capa de muestreo final, no.

Inferencia. En aprendizaje automático, la fase en la que un modelo ya entrenado se usa para generar respuestas a entradas nuevas. Es la fase en la que el usuario interactúa con el sistema.

Temperatura. Parámetro de los modelos generativos de lenguaje que regula cuánto se aplana la distribución de probabilidad antes de elegir el siguiente token. Temperatura cero produce salida determinista codiciosa; temperaturas altas aumentan la variabilidad y, eventualmente, la incoherencia.

Token. Unidad mínima de texto con la que opera un modelo de lenguaje. Puede ser una palabra entera, un fragmento de palabra, un signo de puntuación o una secuencia de caracteres.

Nucleus sampling, top-k, top-p. Familias de técnicas de muestreo aplicadas en la generación de texto para evitar la salida degenerada o repetitiva del muestreo codicioso. Restringen el conjunto de tokens candidatos a los más probables antes de muestrear sobre ese subconjunto.

Compatibilismo. Posición filosófica que sostiene que el libre albedrío, redefinido como capacidad de evaluación reflexiva, es compatible con un universo causalmente determinado. La defendió Daniel Dennett frente a posiciones incompatibilistas como la de Robert Sapolsky.

Referencias

Faisal, A. A., Selen, L. P. J. y Wolpert, D. M. (2008). Noise in the Nervous System. Nature Reviews Neuroscience, 9, 292-303. Referencia central para la sección sobre ruido neural como rasgo funcional y no como defecto.

Libet, B. (1985). Unconscious cerebral initiative and the role of conscious will in voluntary action. Behavioral and Brain Sciences, 8, 529-566. Experimento clásico citado al hablar del potencial de disposición y del retraso de la conciencia respecto al inicio de la decisión.

Maoz, U., Yaffe, G., Koch, C. y Mudrik, L. (2019). Neural precursors of decisions that matter — an ERP study of deliberate and arbitrary choice. eLife, 8. Replicación moderna del paradigma de Libet con la distinción entre decisiones arbitrarias y deliberadas.

Wegner, D. M. (2002). The Illusion of Conscious Will. MIT Press. Fuente para la tesis de la agencia consciente como reconstrucción posterior al acto.

Dennett, D. (2003). Freedom Evolves. Viking. Posición compatibilista citada en el contraste con Sapolsky.

Sapolsky, R. (2023). Determined: A Science of Life Without Free Will. Penguin. Posición incompatibilista radical citada en la sección sobre determinismo y libre albedrío.

Holtzman, A., Buys, J., Du, L., Forbes, M. y Choi, Y. (2020). The Curious Case of Neural Text Degeneration. ICLR 2020. https://arxiv.org/abs/1904.09751. Referencia para la discusión sobre nucleus sampling, top-k y top-p como técnicas de muestreo en modelos de lenguaje.

También te interesa

En otros sitios

#razonamiento #antropomorfismo #inteligencia #papers