Diario Expansión: Deep Seek, pero, ¿qué ha pasado con los chinos y la Inteligencia Artificial?

Rafael Areses
“La historia de la semana en que conocimos a DeepSeek”
La velocidad de lo “que está pasando” hoy en Inteligencia Artificial supera nuestra capacidad de “predecir lo que pasa”. Eso es lo que ha ocurrido esta semana con DeepSeek, ese nombre de los chinos que no dejas de oír por todas partes. La razón que me obliga a escribir este artículo y por la que no debería parecerse mucho a lo que has estado viendo hasta ahora. Verás, resulta que una cadena de acontecimientos ha traído de nuevo la IA al primer plano de nuestra actualidad, y te lo cuento.
Todo empieza con una compañía china creada en 2023, hace dos años. La compañía surge de High-Flyer Quant, un fondo de cobertura que ya utilizaba técnicas de IA desde su origen para el comercio de acciones en la República Popular China. DeepSeek (búsqueda profunda en español) es una tecnológica que nadie conocía hasta el lunes y que ahora está en todos los debates: “los chinos DeepSeek…”. ¿A que sí te suena? Pues bien, la cadena de acontecimientos empieza con el magnífico trabajo de los equipos de desarrollo de DeepSeek que consiguen una herramienta de IA asombrosa que iguala a los mejores modelos masivos de las tecnológicas americanas que hoy dominan el ecosistema de la IA. Lo hacen mucho más barato y, encima, en abierto para que todos lo usemos gratis.
El segundo eslabón de la cadena es que todos los que estamos en este ámbito lo descargamos. Te reconozco, querido lector, que me siento tan responsable como todos los que lo hicimos el pasado lunes 20 de enero. Y por eso aparece la aplicación en el primer lugar mundial de descargas, por encima de chatGPT, que tan bien conoces, y superando en 300% a la estrella de la semana (cada semana hay una), el asistente de Perplexity, que revoluciona nuestra experiencia con los móviles; pues bien, la supera en un 300%, algo inaudito.
A partir de ahí los inversores. El tercer eslabón es la caída de las tecnológicas en bolsa de valores. El índice Nasdaq cae un 3% en general, las magníficas Tech alrededor de un 5% y, sobre todo, el gran referente, Nvidia, que cae cerca de un 17%. De modo que, y para terminar, desembarca el cuarto eslabón. ¿Será el último? Así que toda la opinión pública y los medios se lanzan a dar “la noticia”. ¿La noticia?, ¿la versión de la noticia? o ¿el relato simplista? Y no lo critico porque lo habitual entre las personas normales, es que nos sea imposible tener el tiempo necesario para los detalles de lo que realmente ha pasado. A veces, la realidad está en los detalles, y esta vez no es la excepción. El problema es que nos encanta comprar esas narrativas simplistas, siempre que nos hagan sentir bien y nos refuercen en lo que queremos creer, ¡claro! Nos abruma la IA, así que, aunque no lo reconozcamos, le tenemos la suficiente tirria como para comprar más fácilmente el relato contrario. En este caso me temo que las consecuencias no esperadas puedan ser las contrarias, y por eso te escribo este artículo. Al menos, que no lo sean para ti.
Y, ¿cuáles son esos detalles? No voy a aburrirte estimado lector con el proceso con el que los graduados de las mejores universidades chinas lo han conseguido. Ni se me va a ocurrir explicarte mixture-of-experts, multi-latent attention y multi-token prediction, ni siquiera el Reinforcement Learning que estuvo en el corazón de AlphaGo, aquello que ganó al juego del Go a los humanos y que también conoces. No, quisiera darte cosas que no te aburren, pero que te sirven para entender la realidad. Verás, para entrenar R1, DeepSeek ha utilizado varios modelos LlaMA de la compañía Meta; también utiliza el hardware de Nvidia, casi 3.000 tarjetas GPU H800, si bien no son las más caras, son lo suficientemente buenas como para que pocas empresas puedan permitírselas; y muchos algoritmos ya desarrollados que ellos han ingeniosamente mejorado. Te cuento esto porque creo que ya sabes que la verdad de las cosas a veces está en sus detalles, si los desconoces, ajustarás tu relato a aquello que quieres pensar, aquello que quieres que ocurra, y eso coincide pocas veces con la verdad. Eso y no otra cosa es lo que ha ocurrido en la opinión pública. Es noticia que Nvidia haya caído en un día un 16,9%, pero no lo es que en dos días esté recuperando por el momento la mitad, que OpenAi haya quedado “ridiculizada” por una compañía menor, pero no que su lanzamiento público del modelo o3 de esta semana demuestre que siguen por delante para que les puedan seguir copiando o innovando sobre lo que construyen como en este caso, pero que son los primeros y mejores en crear esas herramientas de IA.
No voy a aburrirte tampoco con los titulares, pero ha habido una versión para cada intérprete de “la noticia”, desde “que vienen los chinos” a “los chinos nos espían”, pasando por “las tecnológicas están sobrevaloradas”, “el proyecto Stargate de la Casa Blanca es papel mojado”, “DeepSeek es la nueva SpaceX”, “David contra Goliat, los chinos hacen por mucho menos lo que Silicon Valley derrocha”, “Elon Musk ¿qué vas a hacer con tu castillo de naipes?”, o la gran favorita “Se pinchó la burbuja de la IA”, la cuarta burbuja que llevamos pinchada en dos años. Por lo que parece, estos chicos de R1 han canalizado más las antipatías hacia los otros de la IA, que la comprensión por aquello que tan ingeniosamente han construido.
Personalmente, llevo utilizando DeepSeekR1 una semana como asistente conversacional, es bueno, en algunas cosas y, para mí, mejor que chatGPT. Llevo utilizando DeepSeekV3, el anterior, un mes, en local porque es de código abierto, para hacer “mis cosillas” de desarrollo, es muy bueno y mucho más barato. Aunque estoy más acostumbrado a Llama3.0 de donde salió, te reconozco que, si lo utilizase más y mejor que yo, sería muy bueno. Sé que no te importan estos detalles técnicos, pero me temo que son útiles para explicar lo que pasa al margen de mis sesgos naturales como humano que soy. DeepSeek no ha cambiado el mundo más allá de lo habitual para los que andamos en esto, aquello que hacemos todos los días. ¿Te he dicho que la velocidad hace ridículas nuestras previsiones? Sencillamente experimentamos y observamos, y últimamente créeme esto va rápido, va en serio y es muy interesante, anímate a participar. Así que experimentando y observando creo que las lecturas que asimismo veo no te van a ayudar mucho. No obstante, fíjate en esto. Que la IA se haga más barata cada día no es nada nuevo, pero este relato de DeepSeek, es muy probable que ayude a empujar a que las pequeñas empresas se lancen, y que la gente que nunca imaginaba experimentar con desarrollos propios en IA desde sus propios dispositivos, también se lancen a intentarlo. Unos cuantos lo hicimos cuando lo vimos posible, el proceso continúa.
No es del todo verdad que los chinos hayan conseguido con menos medios lo que los americanos con muchos más, porque nunca hubieran llegado ahí sin esos medios previos, la realidad no es siempre tan simple. También se dijo que mientras la NASA gastó millonadas en un dispositivo para escribir en las cápsulas Apollo, los rusos llevaron un lápiz. Puede que sea verdad o no, lo que importa es la investigación que permite vivir a humanos en ausencia de gravedad a miles de kilómetros de aquí. A veces parece que volvemos a mirar el dedo apuntando a la Luna. No es verdad que la infraestructura creada no haya sido necesaria, sí que haya sido demasiado cara. Verás, un fármaco cuesta desarrollarlo miles de millones, casi nada replicar esa molécula creada en un genérico, y en el término medio bastante poco hacer un desarrollo ingenioso de una mejora del fármaco, ese es el caso de DeepSeekR1 si lo quieres relacionar con la farmacología. Crear el camino suele ser mucho más costoso que mejorarlo. No es verdad que, al bajar el coste de la IA, las compañías que han creado todo esto hasta aquí se vayan a desmoronar, más bien al contrario, van a fabricar más chips, centros de datos, y más energía para alimentarlos que nunca. No lo sé, porque soy tan mal predictor como todos los demás. Solo te pediré que me acompañes en la observación de qué ha pasado antes y en situaciones similares. Siempre se repite un patrón, cuando una tecnología es más asequible, todos los constituyentes de esa tecnología se utilizan mucho más. Así que utilizaremos más energía, más IA, más software, habrá más desarrolladores, y por supuesto mucha más computación. Magnífica noticia para “los perdedores de esta semana”. No es una predicción querido lector, no confíes por favor en las predicciones, esto es un patrón, y te lo explico, se llama la paradoja de Jevons.
William Stanley Jevons desarrolló su actividad en la Inglaterra de la primera revolución industrial, originalmente en Liverpool, para luego expandirla a Australia y volver a Londres. Se fijó y estudió en la cuestión del carbón, y así tituló su libro. La máquina de vapor aumentó la eficiencia del uso del carbón, por lo que abarató enormemente sus costes de extracción y transporte. Los ciudadanos regulares normales a mediados del siglo XIX, armados con su lógica humana normal, dedujeron que al bajar uno de los dos factores de la multiplicación significativamente, en este caso el precio, entonces el producto final caería y las compañías que iniciaron la primera revolución industrial, se hundirían. Si llamas a esto que estás hoy viviendo, la cuarta revolución industrial, es lo que los inversores y los medios anuncian esta semana para Nvidia, OpenAI, Microsoft, ASML, etc. Y no es verdad, porque eso no pasó, se consumió más carbón mucho más barato y las empresas mineras que lo extraían, los trenes que lo transportaban y las fábricas que lo utilizaban, crecieron mucho más que cuando era más caro. Lo mismo ocurrió con la electricidad en la segunda revolución industrial, los ordenadores en la tercera, y tú lo compruebas cada día en el uso de internet, la nube y tus dispositivos. Los humanos sobre ponderamos el coste del factor multiplicador del producto, y por eso cuando entra en fase exponencial, no somos capaces de intuirlo. Nuestros cálculos y predicciones son erróneas, lo han venido siendo desde hace 300 años, y en muchas ocasiones. Aún así, nos encanta hacer predicciones y arruinarnos apostando por ellas.
Así que hablemos de lo que te importa, puede que debamos prepararnos mejor para un mundo donde la IA fluye de forma natural, digamos silenciosa. Probablemente mucho antes de lo que habíamos pensado, y a través de todos los capilares de la sociedad. A distintos ritmos, pero a todos los sectores, sin excepciones. Desde este lunes no menos, sino un poco más. Sí, porque más gente sabe hoy que se pueden hacer cosas con muchos menos medios. Muchas más cosas y las puedes hacer tú. Y así al aumentar el multiplicador exponencial de la gente que utilizamos día a día esta realidad, lo normal es que el producto global sea exponencial. Nada nuevo, se repite el patrón de utilización de tecnología por humanos, que empieza a ser casi más una constante que una variable. Seguiremos observando lo que pasa esta semana y cual es la “nueva disrupción” que nos trae la siguiente. Construir una de lo que ocurra según nuestras simpatías y antipatías, me temo que ayuda poco. El final de cualquier argumento llega hasta donde se conocen los hechos; a partir de ahí llega “lo simplista”, perdona que te insista, pero a ti eso no te sirve. Y es que las predicciones en una era exponencial ya no son más que eso, porque ¿en algún momento te dije que “lo que está pasando” va más rápido que nuestra capacidad de predecirlo?
Rafael Areses es médico y Director de Tecnologías Emergentes en ALEBAT. Está certificado por la MIT- Sloan Management School en Management y por la Harvard Business School en Strategy. Es autor de los libros: Inteligencia Artificial: Guia para la persona ocupada y La revolución silenciosa: Inteligencia Artificial Generativa en entornos de Negocio.