El problema de definir inteligencia. Si no sabemos qué es, ¿qué estamos llamando inteligencia artificial?

En 2007, Shane Legg y Marcus Hutter recopilaron más de setenta definiciones distintas de «inteligencia» que circulaban por diccionarios, manuales de psicología y libros de IA. Ninguna las cubría todas. Llevamos décadas hablando de «inteligencia artificial» sin haber cerrado primero el sustantivo. Cualquier definición que ofrezcamos será o tan ancha que admite termitas, o tan estrecha que deja fuera a un humano en duelo. Si la palabra no aguanta, lo que viene encima tampoco.

El instinto que no se deja explicar

Reconocemos a una persona inteligente sin esfuerzo. Lo hacemos casi por instinto, igual que reconocemos a alguien que no lo es. Basta un rato de conversación, una decisión observada, un gesto. Sabemos antes de poder decir por qué. Y sin embargo, si nos preguntan qué es exactamente la inteligencia, no sabemos contestar.

Hay quien resuelve problemas en un parpadeo y le llamamos inteligente. Hay quien toma decisiones acertadas bajo presión y le llamamos listo. Hay quien se expresa con una claridad que ordena las ideas ajenas y le llamamos elocuente. Tres etiquetas distintas, tres registros distintos, tres tipos de evidencia distintos. Esas manifestaciones rara vez aparecen juntas en la misma persona, y aun así seguimos llamándolas a las tres «inteligencia», como si fueran capas del mismo mineral.

Lo curioso es que el desajuste no nos incomoda. Convivimos con la palabra sin pedirle cuentas. Funciona en la conversación cotidiana porque la usamos para señalar, no para definir. Señalar funciona hasta que aparece alguien con un producto que dice ser inteligente y entonces, de pronto, la palabra tiene que decir algo y no sabe.

Más de setenta definiciones y ninguna que cierre

Legg y Hutter hicieron algo poco glamuroso. Se sentaron a leer todo lo que se había escrito sobre la inteligencia en diccionarios, en psicología y en informática, y se pusieron a contar. Reunieron más de setenta definiciones distintas para la misma palabra. Más de setenta. Cada una incompatible con varias de las otras, ninguna capaz de cubrir todos los casos sin dejarse algo fuera o meter dentro algo absurdo.

Esto no es una curiosidad académica. Es la grieta sobre la que se está construyendo la conversación pública entera. Cuando una empresa anuncia que su modelo «se acerca a la inteligencia humana», cuando un columnista escribe que la IA ya razona, cuando un regulador legisla sobre sistemas inteligentes, todos están operando con una palabra que nadie ha definido. La palabra hace su trabajo igualmente. Por eso funciona tan bien: porque no significa nada concreto, cabe cualquier cosa dentro.

La inteligencia como conjunto de capacidades

Aceptamos sin problema que la inteligencia es un conjunto de capacidades. Una persona puede ser inteligente. Un animal puede ser inteligente: el pulpo que abre el tarro desde dentro, el cuervo que dobla un alambre para sacar comida, el perro que aprende a engañar al dueño. Incluso un proceso, o un sistema, puede comportarse de una forma que llamamos inteligente: un enjambre que reparte tareas, un mercado que ajusta precios, una colonia que regula la temperatura del termitero mejor que un ingeniero climático. El adjetivo «inteligente» se deja estirar.

El problema empieza cuando pasamos del adjetivo al sustantivo aplicado a una máquina. Que un proceso se comporte de forma inteligente no implica que tenga inteligencia. Es la diferencia entre el resultado y la facultad. ¿Puede un proceso tener capacidades inteligentes, o solo produce un resultado que se le parece? Aquí el lenguaje empieza a jugarnos una mala pasada, porque la respuesta depende de qué pongamos detrás de la palabra, y detrás de la palabra no hemos puesto nada estable.

Y la pregunta más simple, la que casi nadie hace: ¿por qué llamarlo «inteligencia artificial» y no pensamiento sintético, pensamiento artificial, computación lingüística, simulación cognitiva? Cualquiera de esas alternativas sería más honesta con lo que efectivamente hacen estos sistemas. Pero necesitábamos un nombre, y «inteligencia artificial» es el que cuajó. Cuajó porque vende. Y porque vende, ahora estamos atascados con él.

Las definiciones que se usan, y por qué ninguna aguanta

Prueba a definirla. Capacidad de resolver problemas, dirá uno. Bien: una calculadora resuelve problemas. Una termita, también, cuando construye un termitero con regulación térmica que muchos arquitectos envidiarían. Adaptación al entorno, dirá otro. Una bacteria se adapta al entorno con una eficiencia que ningún sistema de IA se acerca a igualar. Manejo de símbolos, dirá un tercero. Una hoja de cálculo manipula símbolos sin parar. Predicción del futuro, comportamiento orientado a objetivos, aprendizaje a partir de experiencia: cada definición funciona hasta que aparece el contraejemplo. Y aparece siempre.

El problema no es que las definiciones sean malas. Es que la inteligencia, sea lo que sea, no se deja capturar por una definición funcional sin que se cuele dentro media biología y media ingeniería. O definimos en grande, y entonces el termostato entra. O definimos en pequeño, y entonces queda fuera el humano que está deprimido, el niño que aún no habla, la persona con una lesión cerebral que no responde al test estándar. La palabra no aguanta el doble filtro.

Legg y Hutter, después de recopilar las más de setenta, propusieron la suya: «la inteligencia mide la capacidad de un agente para alcanzar objetivos en una amplia variedad de entornos». Es elegante. Es universal. Y es, exactamente por eso, casi inútil cuando intentas aplicarla. ¿Qué es un objetivo? ¿Quién lo fija? ¿Qué cuenta como entorno?

Si el agente es un sistema de IA, los objetivos los pone el humano que lo entrena, los entornos los diseña el laboratorio que lo evalúa, y la métrica acaba midiendo lo bien que el sistema hace lo que sus diseñadores quisieron medir. Universal en intención, circular en práctica.

Forma e intención. La trampa lingüística

Emily Bender y Alexander Koller, en un trabajo presentado en ACL 2020 que se ha convertido en referencia obligada para cualquiera que discuta esto en serio, distinguieron entre forma y significado. Un sistema entrenado únicamente sobre texto, por mucho texto que sea, aprende patrones de forma. Aprende qué palabra suele seguir a qué otra. Aprende qué estructura suele responder a qué pregunta. Aprende qué tono se asocia a qué contexto.

Lo que no aprende, porque no está en los datos, es el significado: la conexión entre el símbolo y la cosa fuera del símbolo. Esa conexión, en su definición, se sostiene sobre la intención comunicativa de un hablante que apunta con el signo a algo que no es el signo. Aprender la forma de la pregunta «¿tienes frío?» no implica nunca haber tenido frío, ni haberlo querido nombrar para alguien. Y sin eso, la respuesta es un eco estadístico, no una contestación.

Quien defiende que esa distinción ya no se sostiene, porque los modelos actuales son multimodales y han visto vídeo, imágenes y datos de sensores, está moviendo la línea pero no la está borrando. El argumento de Bender y Koller no decía que el problema fuera la falta de píxeles. Decía que el significado no está en la forma, esté la forma codificada en letras, en píxeles o en señales propioceptivas. La forma se procesa. El significado se tiene. Son dos verbos distintos y la diferencia importa.

Cuarenta años antes, John Searle había contado lo mismo con menos infraestructura. Un hombre encerrado en una habitación recibe papeles con caracteres chinos, los manipula siguiendo un libro de reglas y devuelve papeles con otros caracteres chinos. Desde fuera, parece que entiende chino. Desde dentro, no entiende nada. Manipular símbolos no es comprender. El argumento ha sido refutado mil veces, ridiculizado otras mil, y sigue sin haberse caído. Cada vez que un sistema nuevo pasa el test de Turing actualizado, alguien lo recupera. Es incómodo precisamente porque no se le puede contestar sin definir comprensión, y comprensión está ahí mismo, en la lista de palabras que tampoco hemos definido.

Lo que cuesta nombrar

Hasta aquí, el problema parece filosófico, casi de seminario. Lo es. Pero también es otra cosa, y es la otra cosa la que cuesta de poner por escrito.

La expresión «inteligencia artificial» opera, en la conversación pública y en la política regulatoria, como significante vacío. No quiere decir nada concreto, lo cual permite que cualquier interlocutor proyecte sobre ella lo que le conviene proyectar. El inversor proyecta capacidad de razonamiento general. El regulador proyecta riesgo existencial. El ingeniero proyecta sistema estadístico. El periodista proyecta novela de Asimov. Todos usan la misma etiqueta para discutir cosas que no se parecen entre sí.

Esto no es un accidente del idioma. Es una condición de posibilidad del negocio. Una palabra precisa obliga a comparaciones precisas, a métricas verificables, a promesas que se pueden incumplir. Una palabra que no significa nada concreto permite vender productos diciendo que son inteligentes, atraer capital diciendo que se acercan a la inteligencia general, y pedir regulación diciendo que la inteligencia es peligrosa, todo a la vez y sin contradicción aparente. La ambigüedad no es un defecto del discurso: es su motor económico.

Quien se beneficia de que la expresión no se cierre es quien tiene el poder de definirla en cada momento. Hoy, las empresas que entrenan los modelos más grandes. Mañana, los reguladores que decidan qué entra y qué no entra en sus marcos legales. Pasado mañana, las cortes que tengan que aplicar esos marcos a casos concretos. En cada uno de esos pasos, la indefinición se traduce en un margen de decisión que recae sobre quien tiene la palanca. Y la palanca, ahora mismo, no la tiene quien lee este texto.

La pregunta que queda

Si la palabra inteligencia no aguanta una definición que sirva fuera del laboratorio, y la expresión inteligencia artificial hereda esa fragilidad amplificada por el adjetivo, lo que circula bajo ese nombre puede ser cualquier cosa.

Puede ser un avance histórico en la manipulación estadística del lenguaje. Puede ser un parche caro que produce alucinaciones presentables. Puede ser una herramienta de productividad que cambia el trabajo cognitivo de quien la usa. Puede ser un sistema de extracción de valor sin precedente sobre el trabajo intelectual ajeno. Puede ser las cuatro cosas a la vez, en distinta proporción según el caso. Lo que no es, porque no puede ser, es «inteligencia» en el sentido que esa palabra tiene cuando no la usa una empresa que necesita venderla.

Esto deja al lector en mala posición. La etiqueta seguirá circulando. Las decisiones seguirán tomándose bajo ella. Negarse a usar la expresión es renunciar a participar en la conversación; usarla sin definirla es aceptar las definiciones implícitas de quien la usa con más volumen. No hay buena salida. Hay solo una desconfianza activa cada vez que alguien diga, en una presentación o en una ley o en un titular, que un sistema es inteligente. La pregunta, antes de aceptar la frase, es siempre la misma: ¿qué quieres decir exactamente con esa palabra, y por qué no la has definido antes de usarla?

Definiciones

Significante vacío. Término de la teoría política y lingüística (Laclau, entre otros) que designa una palabra cuyo contenido semántico se ha erosionado hasta el punto de que cualquier actor puede proyectar sobre ella su propio significado. Funciona políticamente precisamente porque no funciona descriptivamente.

Intención comunicativa. En el sentido de Bender y Koller, el acto por el cual un hablante usa un signo para apuntar a algo que no es el signo. Es el componente que sostiene la relación entre forma y significado: sin un agente que quiera decir, los símbolos solo se relacionan entre sí.

Forma (lingüística). El conjunto de patrones observables en un texto: qué palabras coocurren, qué estructuras sintácticas se repiten, qué registros se asocian a qué contextos. Es lo que un modelo entrenado solo sobre texto puede aprender. La forma se procesa; el significado se tiene.

Habitación china. Experimento mental propuesto por John Searle en 1980. Una persona dentro de una habitación recibe caracteres chinos, los procesa según un libro de reglas y devuelve otros caracteres chinos sin entender una palabra. Desde fuera parece comprensión; desde dentro es manipulación simbólica. Argumento clásico contra la idea de que ejecutar un programa equivale a comprender.

Test de Turing. Prueba propuesta por Alan Turing en 1950 según la cual un sistema sería considerado inteligente si un interlocutor humano no pudiera distinguirlo de otro humano en una conversación textual. Históricamente ha funcionado más como ritual de paso simbólico que como criterio operativo: cada vez que se da por superado, alguien levanta una versión más exigente.

Referencias

Legg, S. y Hutter, M., A Collection of Definitions of Intelligence (2007), recopilación de más de setenta definiciones distintas de «inteligencia» extraídas de diccionarios, psicología e informática (los propios autores la describen como una colección de «unas setenta»). Publicado en Advances in Artificial General Intelligence: Concepts, Architectures and Algorithms. Es la base del primer bloque del artículo y la fuente del recuento de definiciones. Preprint en arXiv:0706.3639.

Legg, S. y Hutter, M., Universal Intelligence: A Definition of Machine Intelligence, en Minds and Machines 17, 391–444 (2007). Aquí proponen la definición «la inteligencia mide la capacidad de un agente para alcanzar objetivos en una amplia variedad de entornos», discutida en el cuerpo del artículo. DOI: 10.1007/s11023-007-9079-x.

Bender, E. M. y Koller, A., Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data, ACL 2020. La distinción entre forma e intención comunicativa que articula la sección «Forma e intención» proviene de este trabajo. https://aclanthology.org/2020.acl-main.463/.

Searle, J. R., Minds, Brains, and Programs, en Behavioral and Brain Sciences 3:417–457 (1980). Texto fundacional del argumento de la habitación china, recuperado en la sección sobre forma e intención para mostrar que manipular símbolos no equivale a comprender.

Turing, A. M., Computing Machinery and Intelligence, en Mind LIX:236, 433–460 (1950). Texto fundacional del test que lleva su nombre, glosado al final del artículo como criterio de inteligencia operativa por contraste con definiciones internas.

Para profundizar

Russell, S. (2019). Human Compatible. Artificial Intelligence and the Problem of Control. Viking. Marco contemporáneo sobre los riesgos de no definir bien aquello a lo que se delega capacidad de decisión.

Marcus, G. y Davis, E. (2019). Rebooting AI. Building Artificial Intelligence We Can Trust. Pantheon. Crítica sostenida al deslizamiento entre rendimiento estadístico e inteligencia, útil para extender el argumento sobre la indefinición.

Hofstadter, D. (1979). Gödel, Escher, Bach. An Eternal Golden Braid. Basic Books. Clásico sobre sistemas formales que producen estructura sin acceder a significado; resonancia natural con el problema central del artículo.

Dreyfus, H. (1992). What Computers Still Can't Do. A Critique of Artificial Reason. MIT Press. Crítica filosófica temprana a la equiparación entre cómputo simbólico y comprensión.

También te interesa

En otros sitios

#inteligencia #antropomorfismo #razonamiento #papers

El problema de definir inteligencia. Si no sabemos qué es, ¿qué estamos llamando inteligencia artificial?

El instinto que no se deja explicar

Más de setenta definiciones y ninguna que cierre

La inteligencia como conjunto de capacidades

Las definiciones que se usan, y por qué ninguna aguanta

Forma e intención. La trampa lingüística

Lo que cuesta nombrar

La pregunta que queda

Definiciones

Referencias

Para profundizar

También te interesa

En otros sitios

Relacionados — Mente

Pensamiento y lenguaje. Hablar bien no es lo mismo que pensar bien

Memoria RAM vs memoria humana. Dos cosas distintas con la misma palabra

Cómo computa el cerebro. Veinte vatios y una conciencia

Aún sin comentarios

Deja un comentario