Monday, January 27, 2025

De los 7 billones a los 5 millones: los riesgos de la exuberancia IA



Hay algo que siempre me resultó chocante en el desarrollo de la IA: aparentemente el problema de que no se avance más rápido y con mejores resultados era meramente financiero y de musculo tecnológico (más chips conectados)  

San Altman el pionero, heraldo y estrella IA pop decía hace 11 meses: si me dais 7 billones de dólares (trillion en ingles) hare fábricas de chips conectados con tal poder de procesamiento que alcanzaremos la ansiada AGI (la IA que lo sabe todo-o al menos más que tu) 

No es que no le crea, pero a mi estas cosas del tipo más madera nunca me han parecido ni buena estrategia ni buena solución, por que las innovaciones tecnologías (casi) siempre han surgido de carencias y necesidades no de superabundancia y paradigmas más o menos ideológicos 

Y la semana pasada la realidad de las cosas vino a confrontar esta visión:

la empresa china Deep Seek lanzó el R1 un modelo LLM que igualaba o superaba el rendimiento de modelos en teoría más avanzados, como el o1 de OpenAI,  pero con 600.000 millones de parámetros (600 B) y a un coste de desarrollo de menos de 6 millones de dólares 

R1 cuesta 0,55 US$ por millón de tokens estándar de entrada (input) y 2,19 dólares por millón de tokens de salida (output) y además es Open Soft lo que quiere decir que cualquiera lo puede descargar e implementar o desarrollar

Hay que tener en cuenta que DeepSeek ha entrenado y desarrollado este modelo en medio de las restricciones de chips avanzados, sobre todos los de Nvidia, y con un coste que no es ni la décima parte de lo que se creía hasta ahora que era necesario para hacer un LLM que compitiera con lo que hay 

¿Puede ser una estrategia del gobierno chino para devaluar la estrategia de los US de lograr la supremacía IA a fuerza de tener la tecnología más avanzada y el capital necesario? pues desde luego es una posibilidad , lo que implica que DeepSeek no dice del todo la verdad pero....

Si la empresa china no miente con su R1, entonces estamos de vuelta a un cierto sentido común. Meter más dinero de alto riesgo no garantiza mejores resultados sino inflar un sector que lógicamente esta encantado con las inversiones

Sin olvidar los campeones de esta etapa de picos y palas de la IA, los fabricantes de chips sin los cuales no se te ocurra trabajar en IA , que ya han empezado a comprobar en la bolsa el impacto de R1 

Realmente aunque nos olvidemos momentáneamente : el software abierto a la larga siempre se impone como mejor que el propietario (muchos adoptando y mejorando) y la exuberancia de recursos no es el principio orientador sino la eficiencia (menos recursos pero igual eficacia) 



No comments: