Dónde se piensa la IA de verdad y no es en LinkedIn

Hoy hablamos de un error mío. Llevo bastantes años jugando con esto. En 2005 empecé con un lenguaje que se llamaba Prolog y desde entonces he ido viendo cómo se aceleraban las cosas. Hasta que un día — sería sobre 2022, antes de ChatGPT — decidí que la inteligencia artificial no iba a servir para nada serio. Lo decidí por una razón que entonces me parecía sólida: los resultados de la IA no son trazables. Con un programa normal yo sé qué hace en cada línea. Con una red neuronal no se puede. Eso, pensé, descalificaba la tecnología entera. Diciembre de 2022 estalló ChatGPT delante de mis narices y entendí cuánto me había equivocado. Si le hubiera prestado a TensorFlow la mitad de la atención que le presté a despreciarla, hoy entendería mucho mejor lo que ha pasado. ¿Dónde había estado yo mirando? Y, más importante, ¿dónde había estado pasando?

Tres sitios y un cuarto

Pasaba en MIT CSAIL, en Berkeley BAIR, en CMU Robotics Institute. Pasaba también, según el año, en Stanford y en Toronto. No es ranking — es ecosistema.

MIT CSAIL — Computer Science and Artificial Intelligence Laboratory — tiene su origen en el AI Lab fundado en 1959 y el Project MAC fundado en 1963 con financiación de DARPA. Los dos laboratorios se fusionaron en 2003. Hoy CSAIL es el laboratorio más grande del campus del MIT con más de seiscientas personas. Esto importa porque cualquier idea técnica que pasa por allí se discute con sesenta años de tradición acumulada. La conversación interna lleva décadas de profundidad.

Berkeley AI Research — BAIR — se estableció formalmente en 1990 reuniendo grupos de visión por computador, aprendizaje automático, procesamiento de lenguaje natural, robótica y planificación. Dos docenas de profesores, más de cien doctorandos. La especialidad histórica del lugar es aprendizaje por refuerzo aplicado a robótica. Ese tipo de trabajo no se hace en un máster privado — se hace con laboratorios físicos y financiación a diez años.

CMU Robotics Institute, en Pittsburgh, es el centro de robótica más antiguo del mundo dentro de una universidad. Lo fundó Raj Reddy en 1979. Sus alumni están en todas partes — DeepMind, Anthropic, Boston Dynamics, Tesla, Nvidia.

El detalle que importa no es el ranking. Es que un paper de CMU lo escriben quince personas que también colaboran con Google DeepMind y Anthropic. La frontera entre academia e industria allí es porosa por diseño. En España la frontera es muralla.

Lo que yo no vi

Te lo cuento desde la experiencia personal de no haber estado allí.

En 2009 trabajé intensivamente en procesamiento de lenguaje natural. Lo que se hacía entonces eran motores léxicos. Calculaban probabilidades de la palabra siguiente. Era agotador para las máquinas de la época — las estructuras de cálculo no cabían en la RAM disponible. Doy fe. Yo decidí entonces que la IA «no iba a servir para nada» porque los resultados no eran trazables. Error.

Mientras yo llegaba a esa conclusión equivocada y abandonaba, en MIT, Berkeley y CMU estaban trabajando exactamente en cómo hacer que sí cupiera. En cómo escalar las arquitecturas. En cómo aprovechar GPUs para entrenamiento. En 2012 AlexNet ganó ImageNet con redes profundas sobre GPU y todo cambió. En 2017 Vaswani y siete coautores publicaron «Attention Is All You Need» en NeurIPS. En 2018 Devlin y compañía publicaron BERT. En 2020 salió GPT-3.

Yo no presté atención a TensorFlow cuando se publicó en 2015. Si la hubiera prestado entendería hoy con más claridad lo que ha pasado. Por suerte se puede reconstruir, paper a paper, qué se hizo, cuándo, dónde y por quién. La reconstrucción es lenta pero posible. En 2005 era casi imposible. Hoy es solo cuestión de paciencia.

Esto que cuento no es nostalgia. Es información práctica. La IA que hoy nos asombra estaba ya cocinándose en sitios concretos hace una década. Quien siguió aquellos sitios entiende ahora con mucha más claridad el momento que vivimos. Ten por seguro que la ola que se levanta delante de nosotros nos va a cambiar de arriba abajo, y quien la entendió antes la va a surfear con ventaja.

El truco para leer un paper sin saber matemáticas

Esto es lo que los másteres privados de 13.000 euros no te enseñan, porque si lo supieras no necesitarías el máster.

Un paper de Berkeley o de MIT tiene siempre la misma estructura. Abstract — resumen denso. Introduction — qué problema atacan y por qué importa. Related work — qué hizo la gente antes y dónde se quedó corto. Method — la arquitectura o el algoritmo nuevo. Experiments — qué probaron y con qué datos. Results — qué obtuvieron. Discussion — qué significan los resultados. Limitations — qué no funciona. Conclusion — resumen final.

Para entender el 60% del paper sin formación matemática avanzada basta con leer abstract, introduction, method (saltando las ecuaciones, mirando los diagramas), results (mirando las gráficas) y limitations.

Las limitations son la sección más honesta del paper. Donde los autores reconocen qué problemas no resolvieron, qué casos extremos fallan, qué supuestos no comprobaron. Si un paper no tiene sección de limitations, o la tiene en dos líneas, desconfía. Si la tiene en una página y media con detalles concretos, probablemente es un paper serio.

Para encontrar papers buenos hay tres archivos que conviene aprender a navegar — perdón, conviene no, hay que aprender a navegarlos si quieres entender de qué va esto.

arXiv. Específicamente las categorías cs.AI, cs.LG (machine learning), cs.CL (computational linguistics) y stat.ML. Es archivo abierto. La calidad es desigual porque no hay revisión por pares previa, pero los autores serios publican allí lo primero. Tres días después de la presentación en una conferencia, el paper suele estar en arXiv.

Papers With Code. Agregador que enlaza papers con su implementación y con métricas comparables. Útil para saber si una afirmación se ha replicado.

OpenReview. Donde se publican los reviews de ICLR y de otras conferencias. Allí puedes leer cómo los revisores cuestionaron el paper antes de su aceptación. Si quieres entender por qué un paper se considera serio o no, el diálogo en OpenReview es la mejor pista.

El obstáculo psicológico

No es para investigadores. Lo digo porque me dijeron lo contrario durante años y me lo creí.

Cualquier persona con curiosidad estructurada puede entender el 60% de un paper de Berkeley si le dedica una tarde. Es menos esfuerzo que terminar una serie de Netflix. Más útil que leer una newsletter resumida por un agregador. Más interesante que escuchar a un youtuber explicar el paper con tres meses de retraso y sin haber leído más que el abstract.

El obstáculo es psicológico. Está el efecto del paper como objeto sagrado — la idea de que solo el doctorado da derecho a leerlo. Está el obstáculo del idioma — los papers están en inglés y la documentación técnica no se traduce. Está el formato — la doble columna en PDF intimida al lector acostumbrado al scroll vertical de la web.

Los tres obstáculos son superables. El idioma se resuelve con DeepL o con un asistente generativo haciendo primera pasada, y el lector revisando los términos técnicos que no deben traducirse. El formato se resuelve descargando el PDF a Zotero o a un lector decente. El efecto sagrado se resuelve leyendo dos o tres papers seguidos y comprobando que no son más oscuros que un manual técnico cualquiera.

Las sobras traducidas

Cuando un paper de MIT pasa por la cadena de traducción habitual — paper → tweet de un investigador → artículo de TechCrunch → traducción a Xataka → artículo derivado en El Confidencial → vídeo de YouTube en español — pierde tres cosas críticas.

Pierde el matiz cuantitativo. El paper dice «mejora un 12% en este benchmark concreto bajo estas condiciones». La traducción dice «mejora drásticamente». El lector hispano recibe «drásticamente» sin la cifra ni las condiciones.

Pierde las limitations. El paper dedica una página entera a decir «esto no funciona si tienes menos de tantos datos» o «esto falla con secuencias por encima de tanto». La traducción genérica omite limitations porque «no son lo interesante». El lector recibe el resultado glorioso y nunca recibe el «excepto cuando».

Pierde la contestación. El paper se publica, se discute, otros lo intentan replicar, algunos no lo consiguen, hay correcciones publicadas, hay debate. La traducción genérica recoge solo el momento de la publicación inicial. El lector recibe la noticia y nunca recibe la conversación posterior.

Tres pérdidas. Y todas se evitan yendo a la fuente.

¿Hace falta?

¿Hace falta que un ciudadano normal lea papers de MIT?

No.

Pero hace falta que en España exista una capa intermedia que sí los lea, los traduzca con criterio, los discuta en español con tiempo, los conecte con casos reales locales y los ponga al alcance del lector medio. Esa capa no existe en cantidad suficiente.

Comparado con lo que existe en inglés — Import AI de Jack Clark, The Gradient, Last Week in AI, The Algorithm de MIT Technology Review, los hilos de Lex Fridman — la oferta hispana es insuficiente. Quien empieza a leer papers en serio sin esperar a que se los traduzcan está haciendo un trabajo que el ecosistema editorial español no le facilita. Es una pena. Y es una oportunidad para quien decida montar esa capa intermedia que falta.

Definiciones rápidas

CSAIL: Computer Science and Artificial Intelligence Laboratory del MIT. Fundado en 2003 por fusión del AI Lab (1959) y Project MAC (1963).
BAIR: Berkeley Artificial Intelligence Research. Establecido en 1990.
CMU Robotics Institute: fundado en 1979 por Raj Reddy. Primer centro universitario de robótica del mundo.
NeurIPS, ICML, ICLR: las tres conferencias principales en machine learning. Aceptación competitiva (en torno al 25-30% de los papers enviados según el año).
arXiv: archivo abierto de preprints. Categorías cs.AI, cs.LG, cs.CL son las relevantes para IA.
Papers With Code: agregador que enlaza papers con implementación y métricas.
OpenReview: plataforma donde se publican los reviews de ICLR y de otras conferencias.
Limitations: sección de un paper donde los autores reconocen los problemas no resueltos. Indicador clave de calidad.

Referencias

MIT CSAIL, Mission & History (sitio oficial, csail.mit.edu). Origen del laboratorio en la fusión de 2003 entre el AI Lab (fundado en 1959) y el Laboratory for Computer Science, antes Project MAC (1963, con financiación de DARPA). Es el mayor laboratorio del campus, con más de seiscientas personas.

Berkeley Artificial Intelligence Research (BAIR), sitio oficial (bair.berkeley.edu). Establecido en 1990; agrupa visión por computador, aprendizaje automático, procesamiento de lenguaje natural, robótica y planificación.

Robotics Institute, Carnegie Mellon University, sitio oficial (ri.cmu.edu). Fundado en 1979 por Raj Reddy (con Angel Jordan); primer departamento académico del mundo dedicado en exclusiva a la robótica.

Vaswani et al., Attention Is All You Need (NeurIPS, 2017; arXiv:1706.03762). Citado como hito de las arquitecturas de atención. Ocho autores firmantes.

Devlin et al., BERT. Pre-training of Deep Bidirectional Transformers for Language Understanding (2018; arXiv:1810.04805).

Brown et al., Language Models are Few-Shot Learners (GPT-3) (NeurIPS, 2020; arXiv:2005.14165).

Krizhevsky, Sutskever y Hinton, ImageNet Classification with Deep Convolutional Neural Networks (AlexNet, 2012). Citado como el momento en que las redes profundas sobre GPU ganaron ImageNet.

TensorFlow — biblioteca de aprendizaje automático de Google, liberada como código abierto en noviembre de 2015 (tensorflow.org).

arXiv — archivo abierto de preprints; categorías cs.AI, cs.LG, cs.CL relevantes para IA. Papers With Code — agregador que enlaza papers con su implementación y métricas. OpenReview — plataforma donde se publican los reviews de ICLR y otras conferencias. Las tasas de aceptación de NeurIPS, ICML e ICLR rondan el 25-30% según el año (neurips.cc).

Import AI (Jack Clark, cofundador de Anthropic), The Gradient, Last Week in AI (Skynet Today) y The Algorithm (MIT Technology Review) — citados como ejemplos de divulgación en inglés a partir de la fuente primaria.

También te interesa

En otros sitios

#papers #inteligencia #transformers #divulgacin

Dónde se piensa la IA de verdad y no es en LinkedIn

Tres sitios y un cuarto

Lo que yo no vi

El truco para leer un paper sin saber matemáticas

El obstáculo psicológico

Las sobras traducidas

¿Hace falta?

Definiciones rápidas

Referencias

También te interesa

En otros sitios

Relacionados — Mente

El problema de definir inteligencia. Si no sabemos qué es, ¿qué estamos llamando inteligencia artificial?

Pensamiento y lenguaje. Hablar bien no es lo mismo que pensar bien

Memoria RAM vs memoria humana. Dos cosas distintas con la misma palabra

Aún sin comentarios

Deja un comentario