Esto es una hístoría corta pero también muy representativa del SOTA en el que actualmente nos encontramos en este macrosector que es ahora la IA
En estos 3 años realmente históricos desde que ChatGPT nos obligó a aprender a los neofitos que era eso de un LLM o un transformador en Deep Learning, asistimos con una mezcla de pasividad, esperanza y sorpresa como los LLM se convertían en gigantes aspiradoras (vacuum cleaner) de todo lo que se había publicado en Internet hasta ahora, pero también muchas de las bases de datos y libros que permanecían offline o bien por que a nadie le interesaba o bien por que son tan interesantes que no se permite el acceso
Al parecer la barra libre de todos los datos disponibles en Internet ha tocado a su fin e incluso esa segunda e intermedia fase que fue la de crear datos artificiales etiquetados por expertos para seguir alimentando la voracidad de los nuevos modelos
Para paliar esa falta de oferta de datos han surgido empresas-idea como Moonlake AI que proponen invitar a los usuarios a crear en su plataforma mundos de 3D de ficción pero no para videojuegos o films (no solo) de ciencia ficción sino con el declarado objetivo de servir de daros de entrenamiento a los modelos de IA
Realmente es interesante el proyecto, de hecho han recaudado 28 m US$ hasta el momento, pero lo que más me llama la atención es la gran metáfora que supone el proyecto de Moonlake: imaginar un mundo-plataforma donde los que publicamos (aka hacemos cosas) nos convertimos en generadores de datos para entrenar modelos de IA
En este estadio por el momento hipotético, da igual si lo que publiques tiene calidad o no o si alguien lo ve o no o incluso la temática, ya que sobre todo va a servir para alimentar al modelo. En lo que no se muy bien si es una visión apocalíptica o un reconocimiento light en la etapa post-AI (si todo es IA nada será IA)
No comments:
Post a Comment