DeepSeek y el final del monopolio americano

El 27 de enero de 2025, Nvidia perdió 589.000 millones de dólares de capitalización bursátil en un solo día. Es la mayor pérdida de valor en la historia del mercado estadounidense, sin precedentes comparables. La razón: una empresa china que casi nadie conocía fuera de círculos especializados —DeepSeek— había publicado siete días antes un modelo de razonamiento abierto, DeepSeek-R1, que rendía a la par de los modelos americanos a una fracción del coste. Más exactamente: el modelo anterior, DeepSeek-V3, se había entrenado —según las cifras publicadas por la propia empresa para la corrida final— por unos 5,6 millones de dólares, frente a los más de cien millones que costó GPT-4. La tesis que había gobernado el sector desde 2022 —«sin GPUs Nvidia y sin capital occidental no se entrena un modelo frontier»— se desplomó en 24 horas. La pregunta es qué ha cambiado desde entonces. Y, sobre todo, qué le ha pasado a Europa.

Confieso que el 27 de enero yo también me lo había creído. La supremacía americana parecía un hecho de la naturaleza, no una posición defendible y por tanto atacable. Me pasé meses repitiendo, como casi todo el mundo, que sin las GPUs de Nvidia no se entrenaba nada serio. Estaba equivocado, y no me consuela que lo estuviéramos casi todos. Conviene mirar despacio qué hizo DeepSeek, qué no hizo, y dónde nos deja.

Qué es DeepSeek

DeepSeek es una empresa fundada en 2023 por Liang Wenfeng, un cuarentón formado en la Universidad de Zhejiang, antiguo gestor de un fondo cuantitativo llamado High-Flyer. El fondo había acumulado, antes de las restricciones americanas, una cantidad significativa de GPUs Nvidia para sus operaciones de trading algorítmico. Las estimaciones públicas sobre ese stock varían mucho —desde unas 10.000 unidades A100 hasta cifras especulativas mayores—, así que conviene tomarlas como aproximaciones, no como dato firme. Cuando Liang vio que la frontera técnica de la IA empezaba a producir retornos sectoriales, decidió derivar parte de esa infraestructura a un laboratorio independiente con apuesta clara por open weights: modelos cuyos parámetros se publican y cualquiera puede descargar.

DeepSeek-V2 había salido a mediados de 2024 sin gran ruido fuera de círculos técnicos. DeepSeek-V3 salió a finales de 2024, ya con cifras de coste de entrenamiento que llamaron la atención. Pero el momento estructural fue DeepSeek-R1, publicado el 20 de enero de 2025. R1 es un modelo de razonamiento con cadena de pensamiento explícita —similar a o1 de OpenAI publicado pocos meses antes— pero con dos diferencias decisivas: pesos abiertos bajo licencia MIT, y un paper técnico que describe la metodología completa, incluido un enfoque de aprendizaje por refuerzo con verificación de resultado (en lugar de feedback humano) que abre un camino nuevo para escalar razonamiento sin necesidad de anotadores caros.

En benchmarks publicados, R1 se sitúa cerca de o1 de OpenAI en matemáticas, programación y tareas de razonamiento. El usuario casual no necesita entender los detalles técnicos. Lo que sí necesita entender es la magnitud del cambio que esto produjo en las expectativas del sector.

El 27 de enero, hora a hora

La sucesión de eventos del lunes 27 de enero de 2025 conviene recordarla con precisión porque marca un antes y un después.

Durante el fin de semana del 25-26, los círculos técnicos —Twitter/X, foros especializados, listas de correo de investigadores— habían empezado a difundir el paper de R1 con asombro técnico. La cifra de seis millones de dólares de entrenamiento se discutía con escepticismo. ¿Esconde infraestructura previa que ya estaba pagada? ¿Está midiendo solo la corrida final y omitiendo el coste de las iteraciones previas? Las dudas son legítimas y siguen abiertas. Pero, incluso con un margen amplio de duda, las cifras eran un orden de magnitud inferiores a las de los modelos americanos.

El lunes 27 a la apertura, las acciones de Nvidia abrieron en caída. Marc Andreessen había publicado durante el fin de semana que R1 era «uno de los avances más impresionantes y sorprendentes» que había visto. Los inversores institucionales empezaron a vender. El primer movimiento fue en chips. Nvidia cayó un 10% en la pre-apertura. Cuando abrió el mercado regular, la caída se aceleró hasta el 17% al cierre. ASML cayó. AMD cayó. Broadcom cayó. Los proveedores de centros de datos —Vertiv, Eaton— cayeron. El índice Nasdaq 100 perdió un 3%. El S&P 500 perdió un 1,5%. Jensen Huang, CEO de Nvidia, vio cómo su patrimonio personal se reducía en 20.100 millones en una jornada.

La pérdida de 589.000 millones de dólares de capitalización de Nvidia no es solo un dato bursátil. Es la traducción material de un cambio en las expectativas del sector. Los inversores estaban descontando dos cosas. Primero, que si modelos competitivos se pueden entrenar con muchos menos chips, la demanda futura de GPUs Nvidia podría ser menor de lo que había llevado el precio a la estratosfera durante 2023-2024. Segundo, y más estructural, que la tesis del «monopolio americano» —solo unas pocas empresas con acceso a hardware puntero pueden producir modelos frontier— acababa de sufrir un golpe del que no se iba a recuperar.

La paradoja del coste y el debate técnico

Conviene matizar las cifras porque hay una discusión técnica honesta abierta y no se puede dar por cerrada.

El paper de DeepSeek-V3 reportaba un coste de entrenamiento de la corrida final de unos 5,6 millones de dólares, calculado multiplicando horas-GPU consumidas por el precio horario teórico de un H800. Esa cifra excluye explícitamente otros costes asociados —investigación previa, iteraciones fracasadas, datos preparados, infraestructura amortizada, personal—. Críticos legítimos han señalado que el coste total real del proyecto está probablemente más cerca de varios cientos de millones acumulados si se cuenta todo. Un proyecto financiado, recordemos, desde el fondo cuantitativo High-Flyer que tenía acceso previo a GPUs adquiridas antes de las restricciones americanas de exportación.

Iba a escribir que la cifra de 5,6 millones es un titular tramposo, y lo es. Pero me freno, porque centrarse en si fueron seis millones o seiscientos es perder el punto. Incluso aceptando todos los matices, dos cosas siguen siendo ciertas. Una: el coste marginal de entrenar un modelo competitivo, una vez que se tiene la metodología y la infraestructura, ha caído de manera dramática. Las técnicas que DeepSeek demuestra —arquitectura mixture-of-experts más eficiente, entrenamiento con menos datos pero mejor curados, aprendizaje por refuerzo con verificación— son público dominio una vez publicado el paper. Cualquier laboratorio del mundo con acceso a unos miles de GPUs puede ahora replicar el camino. La barrera de entrada se hundió.

Dos: las cifras concretas son menos importantes que el efecto político. Los gobiernos, los inversores, los reguladores y los competidores actuaron como si las cifras fueran reales. Las administraciones presupuestaron en consecuencia. Las decisiones de inversión y de política se tomaron sobre esa base. La realidad económica del sector cambió por la percepción, independientemente de cuál fuera la cifra exacta. En geopolítica de la IA, lo que se cree es, durante meses o años, lo que opera. Y lo que se cree desde el 27 de enero de 2025 es que China puede.

La respuesta inmediata del sector

Los meses posteriores fueron de reacción acelerada. Meta sacó Llama 4 en 2025 con apuesta más agresiva por open weights. Y OpenAI, que hasta entonces había hecho de su nombre una ironía, terminó publicando en agosto de 2025 GPT-OSS, un modelo de pesos abiertos —algo impensable en su estrategia el año anterior—. Los laboratorios europeos y canadienses, Mistral y Cohere entre ellos, leyeron el mismo mensaje cada uno a su manera.

Y el Bureau of Industry and Security (BIS) estadounidense, responsable de los controles de exportación de chips a China, se encontró con un debate interno difícil. Si los controles habían sido diseñados para frenar el desarrollo de IA china manteniendo la frontera técnica en Estados Unidos, y China había publicado un modelo competitivo a pesar de los controles, ¿qué función estaban cumpliendo realmente los controles? Una postura dura argumenta que sin los controles China habría llegado antes. Otra postura, más matizada, argumenta que los controles aceleraron la innovación china en eficiencia: forzados a hacer más con menos, los equipos chinos desarrollaron técnicas que después circularon globalmente y socavaron la posición competitiva de la propia frontera americana.

Sea cual sea la lectura, el sector cambió. Hasta enero de 2025 la pregunta era «cuándo abrirá China la brecha técnica». Después de enero de 2025, la pregunta es «en qué medida China la ha cerrado ya». El AI Index 2026 de Stanford confirma cifras: el modelo líder de Anthropic en marzo de 2026 está solo 2,7% por delante del mejor modelo chino en evaluaciones comparativas. La brecha, cualquiera que fuese, está prácticamente cerrada.

Europa antes de DeepSeek

Aquí, como europeo, toca la parte que más me cuesta escribir sin sonar resentido. Europa, antes del 27 de enero de 2025, llevaba dos años aceptando un papel secundario en el sector con una mezcla extraña de fatalismo y de orgullo regulatorio. El relato oficial era: «no podemos competir en frontera, pero somos los que regulamos mejor». El AI Act se vendía como liderazgo, cuando estructuralmente era una respuesta defensiva ante un sector que se hacía fuera del continente.

La realidad operativa: ninguna empresa europea estaba en el top mundial de modelos frontier. Mistral, fundada en París en 2023 por exinvestigadores de Meta AI y DeepMind, era el único laboratorio europeo con presencia internacional, pero competía en una división inferior. Las grandes corporaciones europeas —SAP, Siemens, las telecos— consumían IA de proveedores americanos, no la producían. Los hyperscalers europeos eran inexistentes: AWS, Azure y Google Cloud copaban el mercado cloud continental con una cuota conjunta que las estimaciones del sector sitúan en torno al 70%. El gobierno francés invertía en Mistral, el alemán hablaba de soberanía digital, la Comisión Europea publicaba estrategias, pero el flujo neto de capital, talento y cómputo era hacia fuera.

El imaginario de la sumisión: Europa como mercado donde se vende lo que otros producen. Compradora de IA, no productora. El AI Act como muro arancelario disfrazado de protección al ciudadano. La industria europea como integradora de tecnología americana en sectores tradicionales —banca, industria, salud—. Esa era la posición. Y se asumía como inevitable.

Europa después de DeepSeek

DeepSeek hizo algo que la dinámica americana no había podido hacer: despertó a Europa de la resignación. Si China podía hacer un modelo competitivo con menos recursos, la pregunta «¿por qué Europa no?» dejó de ser retórica. La excusa estructural —«no tenemos suficientes GPUs, no tenemos suficiente capital, no tenemos un ecosistema»— quedó más difícil de defender. Si lo importante no era el tamaño bruto del clúster sino la eficiencia del método, el continente que más sabía de eficiencia industrial podía, en teoría, recuperar terreno.

Las semanas posteriores fueron las primeras en cinco años en las que la conversación europea sobre IA sonó diferente. Bruegel publicó un análisis sobre el «compute gap» europeo con propuestas concretas. La Comisión empezó a hablar en serio de capacidad de cómputo soberana. El Eurogrupo discutió fondos específicos. Y, sobre todo, Mistral encontró el aire para presentar en Bruselas, en abril de 2026, su documento titulado European AI: A Playbook to Own It, una hoja de ruta para construir IA en Europa en términos europeos.

Mistral cerró en septiembre de 2025 una ronda Serie C de 1.700 millones de euros (algo menos de 2.000 millones de dólares) liderada por ASML —la holandesa que fabrica las máquinas de litografía con las que se hacen los chips frontier—. La operación tiene una elegancia geopolítica considerable: el actor europeo más relevante en el cuello de botella físico del sector entra como inversor del actor europeo más relevante en el cuello de botella técnico. En el ecosistema de la dependencia mutua, ASML y Mistral se sostienen mutuamente. No es independencia total, pero es un paso.

En noviembre de 2025, Francia y Alemania anunciaron junto a Mistral y SAP un acuerdo para construir un stack de IA soberana destinado a las administraciones públicas, con la firma del acuerdo vinculante prevista para mediados de 2026 y los despliegues escalonados en el período 2026-2030. La compra pública, durante años despreciada en discusiones sobre innovación, está empezando a ser la palanca con la que los gobiernos europeos sostienen capacidad propia. El relato cambia. No es liderazgo de frontera, pero ya no es sumisión.

¿Cuánto ha cambiado realmente la proyección europea? Honestamente, todavía poco en cifras absolutas. Las inversiones europeas siguen siendo una fracción de las americanas o chinas. El talento sigue saliendo. El cómputo sigue concentrándose fuera del continente. Pero, por primera vez en cinco años, hay vocabulario en circulación que no es solo defensivo. Soberanía digital, compute gap, pesos abiertos como estrategia europea, integración con ASML como activo continental. La conversación se ha rearmado. La acción tardará. Pero la conversación cambia siempre antes que la acción.

El nuevo mapa

Lo que ha quedado tras DeepSeek se parece más a un mapa con cuatro bloques que a la carrera entre dos empresas americanas que era hasta 2024.

Estados Unidos sigue con la frontera técnica más capaz, pero su ventaja se mide en márgenes pequeños y decrecientes. OpenAI, Anthropic, Google DeepMind, xAI, Meta AI. Capital ilimitado, talento concentrado, infraestructura masiva, pero el problema de la rentabilidad sigue abierto y la energía sigue siendo restricción operativa.

China ha emergido como el segundo polo con DeepSeek, Alibaba (Qwen), Tencent y otros laboratorios. Estrategia agresiva en open weights, financiación estatal cruzada, mercado interno enorme que valida los productos antes del despliegue internacional. Capacidad demostrada de competir en frontera.

Europa empieza a perfilar un tercer polo con Mistral, Aleph Alpha, Silo AI y otros laboratorios menores. Apuesta diferenciada por soberanía y por integración en administraciones públicas. Capital y talento limitados. El tiempo dirá si es un polo o un deseo.

Y el sur global empieza a aparecer en mapas que antes ignoraba. La adopción de modelos chinos abiertos en India, en África, en América Latina, en el sureste asiático produce un sistema policentrico donde el ciudadano de Yakarta o de Lagos no depende necesariamente del stack americano. La «inclusividad» como bandera china tiene su lado de propaganda, pero también produce, materialmente, capacidad técnica desplegada en sitios donde la oferta americana llega cara o no llega.

Escribo «monopolio» y me corrijo solo al releerlo, porque ya no lo es. Las decisiones de inversión, de regulación, de talento, de infraestructura, de política industrial, se toman ahora desde otra premisa: la frontera de la IA es disputada. A mí lo que me deja inquieto no es que China haya llegado. Es que llegó publicando el método. El paper estaba ahí, gratis, para cualquiera con unos miles de GPUs y ganas de copiar el camino. Y nadie en Occidente, ni los inversores que descontaban demanda infinita de chips ni los reguladores europeos que confundían un AI Act con una estrategia industrial, lo había contado con esa posibilidad. La barrera de entrada que se daba por física resultó ser, en buena parte, una creencia. Las creencias se desploman en un día.

Definiciones

Open weights es la estrategia de publicación de modelos en la que los parámetros entrenados se distribuyen abiertamente para que cualquiera pueda descargarlos, ejecutarlos y modificarlos. Es distinto del open source puro, porque puede no incluir los datos de entrenamiento ni el código completo.

Reasoning model (modelo de razonamiento) es un modelo de lenguaje optimizado para producir cadenas de pensamiento explícitas antes de dar la respuesta final. Resulta más caro de ejecutar, pero más capaz en tareas matemáticas, científicas o lógicas; DeepSeek-R1 y o1 de OpenAI son los referentes.

BIS (Bureau of Industry and Security) es la agencia del Departamento de Comercio estadounidense responsable de los controles de exportación de tecnología sensible, incluidos los chips de IA frontier hacia China desde 2022.

Compute gap es la brecha en capacidad de cómputo dedicada a IA entre regiones. Europa la discute como déficit estructural frente a Estados Unidos y China, y la discusión ha cobrado fuerza nueva tras DeepSeek.

Referencias

Bloomberg (enero de 2025), en su crónica sobre la caída bursátil del 27 de enero, cifró en 589.000 millones de dólares la pérdida de capitalización de Nvidia. Disponible en https://www.bloomberg.com/news/articles/2025-01-27/asml-sinks-as-china-ai-startup-triggers-panic-in-tech-stocks

CNBC (27 de enero de 2025) documentó la caída del 17% de Nvidia y la pérdida de cerca de 600.000 millones de capitalización en una jornada, usada aquí para los datos del desplome. https://www.cnbc.com/2025/01/27/nvidia-sheds-almost-600-billion-in-market-cap-biggest-drop-ever.html

Fortune (28 de enero de 2025) recogió, con base en el Bloomberg Billionaires Index, la caída de unos 20.100 millones de dólares en el patrimonio de Jensen Huang ese día, dato citado en el artículo. https://fortune.com/2025/01/28/nvidia-founder-jensen-huang-20-billion-blow-net-worth-deepseek-bloodbath/

DeepSeek (enero de 2025), DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, paper técnico que describe la metodología de R1. La cifra de coste de entrenamiento de unos 5,6 millones de dólares aparece en el informe técnico del modelo anterior, DeepSeek-V3.

Stanford HAI (2026), AI Index Report 2026, fuente de la cifra del 2,7% de ventaja del modelo líder estadounidense sobre el mejor modelo chino. https://hai.stanford.edu/ai-index/2026-ai-index-report

Mistral AI (2026), European AI: A Playbook to Own It, hoja de ruta presentada en abril de 2026. https://europe.mistral.ai/

García-Herrero, A. y Martens, B. (2026), Europe needs a strategy to close the artificial intelligence compute gap, análisis publicado por Bruegel. https://www.bruegel.org/analysis/europe-needs-strategy-close-artificial-intelligence-compute-gap

SAP (noviembre de 2025), nota sobre la alianza con Mistral AI y los gobiernos francés y alemán para una IA soberana en la administración pública, base de los datos del acuerdo. https://news.sap.com/2025/11/sap-mistral-ai-new-alliance-european-sovereign-ai/

Lehdonvirta, V. (2022), Cloud Empires, MIT Press.

Lee, K.-F. (2018), AI Superpowers, Houghton Mifflin Harcourt.

Allison, G. (2017), Destined for War, Houghton Mifflin Harcourt.

También te interesa

En otros sitios

#deepseek #geopoltica-ia #controles-de-exportacin #modelos-abiertos #nvidia

DeepSeek y el final del monopolio americano

Qué es DeepSeek

El 27 de enero, hora a hora

La paradoja del coste y el debate técnico

La respuesta inmediata del sector

Europa antes de DeepSeek

Europa después de DeepSeek

El nuevo mapa

Definiciones

Referencias

También te interesa

En otros sitios

Relacionados — Materia

Por qué leer a IBM sobre IA es perder el tiempo

Quién es realmente OpenAI

Anthropic y OpenAI, dos formas de entender la IA

Aún sin comentarios

Deja un comentario