Friday, June 27, 2025

YouTube AI Overviews y sentido completo


YouTube anunció justamente ayer que comenzaría a añadir AI Overviews inicialmente para sus clientes Premiun en los US (casi 14 US$ al mes), ciertamente nada extraño dentro de la divulgada estrategia de Alphabet de añadir IA a toda su gama de productos y servicios 

Los AI Overviews son, sin demasiadas vueltas, resúmenes o visiones comprimidas tanto de búsquedas en Google como ahora de videos en YouTube, generados por su modelo Gemini y cuya función, al menos de momento, es no hacer perder el tiempo leyendo/viendo algo que no se ajusta a la búsqueda (o sea, como todos los resúmenes!) 

La intención de los AI Overviews ahora en YouTube es sugerir un carrusel de videos que podrían interesar más al usuario, lo que va a tener al menos dos consecuencias: 

la primera y conocida es una vuelta de tuerca más en el proceso de recomendación de videos que YouTube lleva haciendo años atrás o si lo prefieres como parte del invisible pero apreciable trabajo del algoritmo de recomendación que bajo cualquier punto de vista funciona como una Inteligencia Artificial (eso si pre-ChatGPT)

La segunda y probable consecuencia es que muchos usuarios de YouTube se sientan  suficientemente satisfechos con la visión de estos clips en carrusel y literalmente pasen de activar el video sugerido en cuestión, lo que como te puedes imaginar no creo que entusiasme a los creadores de videos 

No es hipótesis descabellada por que los AI Overviews en Google están produciendo eso, menos visitas desde Google a webs externas, por que la IA esta haciendo un descreme de lo aparentemente importante para el que busca sin abandonar la plataforma de rebote (entro y me voy) que hasta hace bien poco era Google 

¿Hay solución a esto ? bueno Google ya ofrece un sistema de pop-ups que permite a los usuarios la posibilidad de elegir como quieren ver la web seleccionada, pero como todo elemento intermedio que interrumpe y dilata el acceso, no lo veo como una solución al menos para todos

En el caso de los videos en YouTube creo que los AI Overviews apuntan a un debate interesante

que los creadores de videos tienen que cambiar su manera de narrar para que sus videos tengan sentido completo solamente o principalmente si se consumen de principio a fin, lo que asumo dejara en la cuneta de la escasa rentabilidad a tanta chorrada formateada que solo persigue captar una atención de baja calidad 

Wednesday, June 25, 2025

Entrenando LLM con libros: el limite del fair use (nueva sentencia)

La novedad legal que supone el uso creciente de modelos LLM como forma de acceso a información contenida en (casi) cualquier fuente original es la causa de las demandas por violación del copyright que vemos y veremos durante un tiempo 

En esencia, las empresas de IA que desarrollan modelos LLM necesitan entrenar a estos con todo lo disponible para incrementar la precisión de sus respuestas (y aun así tienes alucinaciones!) y en ese agujero negro aspirador entran también los libros 

¿El problema? que algunos autores y editoriales no tienen nada claro que usar sus publicaciones sin permiso para entrenar un modelo LLM no sea una forma de robo (léase lo usas sin permiso). Por eso, las sentencias judiciales que se vienen sucediendo son tan importantes y significativas de por donde podrían ir las cosas al menos hasta la siguiente etapa 

El más reciente ejemplo nos deja algunas pistas importantes: 

Anthropic, la empresa del bot Claude, acaba de ganar, al menos parcialmente, una demanda colectiva interpuesta por 3 autores el pasado año por infringir derechos de autor de ni más ni menos que 5 millones de libros para entrenar sus LLM 

Como la demanda colectiva evaluaba el daño en 150.000 US$ por libro esto llevaría a una indemnización ruinosa para cualquiera de más de 750 millardos de dólares (billions), por lo que rápidamente el juez a cargo en el distrito norte de California desestimo rápidamente la demanda colectiva

Y esta semana apareció una primera sentencia que dice textualmente que entrenar un LLM con libros está dentro de lo que la sección 107 de la Ley del Copyright reconoce como Fair Use, ya que literalmente los libros se utilizar como material para entrenar (educar) al modelo 

Con esta sentencia se da un primer respiro a los desarrolladores de LLM, pero con un seria advertencia: la sentencia reconoce este Fair Use solo para libros que estas empresas hayan adquirido legalmente ya sea en papel o digital, pero NO para los que hayan bajado de sitios piratas 

El problema es que Anthropic y seguramente no es la única, utilizó para entrenar sus LLM y crear su biblioteca central (una especie de repositorio de datos de todo lo que se publica) tanto libros que compraron como libros que bajaron de estos sitios poco respetuosos con el Copyright y ahí es donde la sentencia está en el aire a la espera de evaluar el potencial daño 

Hay un párrafo de la sentencia que me parece muy significativo de como se entiende la ley: si te bajas un libro de un site pirata aunque luego te lo compres sigue siendo una infracción del derecho. Lo que cierra la puerta de momento a futuras expiaciones en nombre de la innovación 

por supuesto que esta sentencia NO será la ultima y tampoco crea la jurisprudencia aplicable en estos casos por que la IA ha abierto una brecha en el concepto de obra original, tal como ya vimos el año pasado en una demanda de dos medios contra OpenAI, ya que los bots como ChatGPT o Claude crean respuestas originales basadas en datos con los que han sido entrenados los LLM que usan, pero no reproducen literalmente nada

Como veis esta nueva forma de creación se parece sospechosamente a lo que ha sido siempre, autores que se basan en la obra previa de otros autores, y la diferencia ahora es básicamente la escala 

Monday, June 23, 2025

Hablando de diluir el valor de la música: IA y streaming

Siempre que aparece una tecnología nueva un pequeño nicho de avispados usuarios (early adopters?) encuentran una manera de sacarle provecho a veces justo en el limite de las leyes y otras directamente al otro lado, asumiendo que estas oportunidades son tan efímeras como el tiempo que se de la adopción masiva 

La música nuevamente está siendo un sector diana de lo que la tecnología puede hacer, esta vez con herramientas de IA que permiten generar canciones o incluso catálogos enteros de música al estilo de, o inspirada en, o en algún caso (siempre minoritario) creando algo completamente original 

El volumen de música generada mediante IA ha dejado en poco tiempo de ser una anécdota nerd a suponer una nueva amenaza tanto para compositores y ejecutantes como para plataformas de distribución en streaming 

Un ejemplo, la francesa Deezer acaba de poner en funcionamiento el primer sistema de etiquetado de canciones generadas con IA como medida para advertir a los consumidores de su plataforma que esa música la ha hecho algún modelo basado en machine learning 

Los datos de la propia Deezer señalan que el 18 % de las 20.000 canciones que se suben a diario a la plataforma son generadas completamente con IA, el matiz es importante por que la composición de música y el largo etcétera ayudado/auxiliado con IA debe ser tan generalizado que ya ni siquiera se tiene en cuenta 

Hay varias razones que explicarían porque una plataforma de streaming como Deezer hace esto: 

en primer lugar, posicionarse en esta línea de defensa de la creación humana frente a la artificial, lo que de momento tiene buena prensa y te garantiza el reconocimiento de los artistas 

Es curioso por que la propia Deezer afirma que solo el 0,5% de la música que se reproduce (streams) en su plataforma ha sido compuesta con IA o por IA, lo que en principio NO parece una amenaza a corto plazo para los titulares de derechos de autor, sin embargo el peligro es que aunque son pocas el 70% de estas canciones son composiciones fraudulentas (o sea, que copian a un artista sin pudor algorítmico)

Y otro factor, si componer música es tan sencillo como aprender a manejar herramientas de IA, algunas de ellas desarrolladas por grandes y populares empresas de IA, entonces el efecto previsible es que el valor total del catalogo de canciones que tienes en la plataforma se diluye, simplemente por la fuerza bruta de añadir más y más canciones cuyo coste de producción es prácticamente cero 

Desde el punto de vista de la estrategia de negocio creo que Deezer y los Spotify etc tienen razón; aumentar artificialmente su catalogo no es bueno para (casi) nadie por que diluye su valor. Ahora bien, ¿no es esto lo que ha venido ocurriendo desde la digitalización de la música (con los CD´s) a principios de los años 80?  

¿No diluyó el streaming el valor de la música, al ofrecer todo el catalogo de todos los artistas en todas partes y dejando una ventana abierta para subir más de 120.000 canciones al dia ? 

La creación artificial añade un flujo más a toda esta marea que venimos viendo hace 30 años, y aunque entiendo y comparto parte de las quejas y argumentos de los artistas, el mayor peligro lo veo si demonizamos la IA y la convertimos en la nueva etiqueta punk (léase contra el sistema) de la música popular 

Friday, June 20, 2025

Canales de TV en Netflix: el particular caso TF1 en Francia

La realidad del mercado y sobre todo la estrategia de negocios suelen dejar obsoleta cualquier clasificación que se intente establecer como básica en (casi) todos los sectores pero especialmente en esa pared permeable y abierta que son ahora los medios, las empresas de tecnología y yo añadiría la industria del ocio en general 

Veamos algún ejemplo reciente: el grupo frances TF1 (propiedad a su vez del grupo Bouygues) acaba de firmar un acuerdo con Netflix para incluir sus 5 canales en abierto y su propia oferta de contenidos VOD dentro de la plataforma de la primera  

Según la propia Netflix es la primera vez que llegan a acuerdo de este tipo, a saber con un broadcaster convencional asociado para muchos con la TV de (casi) toda la vida (aunque en realidad la TV como medio sufrió varias reinvenciones en 70 años!)

A partir de aquí hay varias reflexiones cautelosas: 

¿es el principio del fin de la diferencia entre un broadcaster y una plataforma SVOD? 

en realidad las pasarelas entre modelos de comercialización siempre estuvieron abiertas por que al fin lo que se persigue es rentabilizar las inversiones 

¿Netflix se quiere convertir en la aspiradora de todos los medios? 

es una hipotesis si, esto es que Netflix sea la plataforma bajo la cual se reubica toda la oferta que antes llamábamos TV, radio, cine y el etcetera

Aunque no lo termino de ver plausible por que incrementar la oferta con tanta variedad abrumaría y despistaría más al abonado (recuerda es de pago !) que sinceramente a estas alturas de la película busca esa deliciosa palabra que se llama curación de la oferta 

¿Es un guiño a Francia para que no le aprieten más las tuercas con las leyes proteccionistas?

mira por donde que sin descartar las anteriores me suena más probable conociendo la actitud francesa ante la colonización cultural (como ellos le llaman) de todo lo que no sea francés (MFGA!), de hecho Netflix lleva invirtiendo en producción autóctona el 20% de sus ingresos en el mercado francés durante los últimos 3 años 

¿Esto cambia el modelo de negocio de Netflix?

NO. A Netflix ni a sus competidores les ha importando nunca el mercado de aquellos que pasan de pagar por ver la tele (aka video) al menos a estas alturas. Ni tampoco veo que un abonado a Netflix ni en Francia o donde intenten repetir el modelo salte de elegir (VOD) a ver un canal lineal si no era antes un espectador más o menos fiel a ese canal 

En esencia, menos etiquetar con categorías y más interpretar las necesidades y estrategias de las empresas en los mercados donde operan, al menos si quieres enterarte de verdad de que va esto


Thursday, June 19, 2025

Consumo y rentabilidad en medios: digitales (aún) menos rentables que convencionales

Soy consciente de que esto parece uno de esos titulares clickbait (para que hagas click), pero los datos los muestra y demuestra McKinsey en su último informe sobre medios

Los medios digitales (nativos) obtienen todavía menos rentabilidad, en gasto por consumidor e ingresos, respecto a su cuota de consumo, que los que solemos llamar medios tradicionales (legacy) como la TV lineal o la prensa en papel 

Dicho esto empezamos con un no obstante, la tendencia es que los medios digitales (que de nuevos ya no tienen nada) alcancen el umbral de rentabilidad a partir del cual sus ingresos serán proporcionales o superiores a su cuota de consumo y los medios tradicionales sigan perdiendo su porción de tiempo consumido y los ingresos le sigan

Pero la foto actual del sector que nos entretiene e informa es la que es: 

En los US, mercado de referencia aún, la TV de toda la vida (de pago o en abierto) tiene un share de consumo del 21%, un punto por encima del video en streaming, pero la vieja tele se lleva el 26% de los ingresos (revenue) del sector y el 33% de los beneficios !!

La rentabilidad de los distintos medios u ofertas de ocio se mide de una manera muy simple: cuantos dólares te proporcionan por cada hora de tiempo consumo y el ranking en los US y a día de hoy nos muestra que...

Los deportes en vivo, los parques temáticos y los conciertos de música en directo son con mucho los más rentables del sector con 32, 25 y 17 dólares por hora respectivamente, lo que te permite entender la orientación de las inversiones en el sector 

El sector de los medios y el entretenimiento a pesar de su presencia y notoriedad cultural y social no es lo que se dice muy rentable ya que, siempre con datos de los US, por cada hora de consumo los ingresos rondan los 36 centavos 

El contexto de los medios tras 30 años de Internet es bien conocido: más oferta a través de más canales y más dispositivos pero atención no elástica, lo que significa que la gente reparte su atención entre (casi) todo lo que le ofrecen y el nuevo juego es no solo quien capta esa atención sino quien captura la atención de más calidad (estoy absorto en esto que me encanta!)

En efecto los números de cuanto te consumen son significativos pero cada vez menos, por que como puedes comprobar en esos tiempos de transito entre tareas, como el transporte público o colectivo, los consumidores pasan el rato con (casi) cualquier contenido que le llene los pixeles y les permita hacer scrolling (zapping digital)

Tuesday, June 17, 2025

¿Cuántos (realmente) pagan por las noticias? tocando techo

Cuando a mediados de la pasada década los principales diarios del mundo comenzaron a levantar muros de pago (pago por acceso), la mayoría de los editores tenían ya en mente los limites, riesgos y oportunidades de este modelo de negocio

Pero hay algo que no se podía saber con certeza del todo y es cuantos iban a pagar por las noticias. O en otras palabras donde estaba el techo al modelo de suscripción en un sector que dio un triple salto al vacío en memos de 25 años: un cambio de medio, un cambio de soporte y un cambio de modelo de distribución (por no hablar de nuevos e inesperados competidores)

El último informe del Instituto Reuters en Oxford nos aclara ahora parte de las incógnitas:

En los 20 años principales mercados mundiales tan solo el 18% de la población encuestada reconoce pagar por las noticias en cualquier medio  

Aunque algunos datos de este ranking eran mas o menos previsibles como que los países del norte de Europa son los más propensos a suscribirse a un medio informativo, lo cierto es que de Holanda hacia abajo todos los países están por (o muy) debajo de la media (En España y UK tan solo hay un 10% de suscriptores de noticias)

El informe de Reuters dice además que los US están por encima de la media mundial pero por muy poco, apenas un 20% de los encuestados reconoce pagar por informarse y eso en el país del WSJ y el NYT pioneros ambos del pago por acceso y siendo ambos diarios de referencia 

Como ya han pasado 20 años del cambio hacia el modelo de pago -paywall-  es más que probable que estos números indiquen el fin de la progresión o si prefieres que el techo de los que consideran pagar por noticias o se ha alcanzado o le queda muy poco (1 de cada 5 paga por noticias ese es tu mercado alcanzable!)

Es cierto que las suscripciones a los diarios se han ido paquetizando (bundling) pero también que en muchos casos los que pagan lo hacen por otra cosa que NO es el diario, lo que financieramente tiene sentido (gato blanco gato negro) pero no se muy bien desde el punto de vista de la misión de un medio informativo

Monday, June 16, 2025

Telecos y reducción de empleo: automatización y costes laborales

Las telecomunicaciones fueron el primer y preferente sector que me llamó la atención en mi largo paso como estudiante en la universidad

Considerado como sector estratégico por la mayoría de los gobiernos, ésta fue una de las razones por las que en Europa fue un monopolio , con fuerte intervención pública, hasta bien entrados los años 80´s, con el consiguiente diferencial de precios y servicios con los US, incluso con el monopolio de la ATT que se mantuvo hasta 1984 

Como digo (casi) siempre a mis estudiantes, los monopolios tienen mala prensa entre los consumidores (te pongo el precio que quiero), pero NO para los que trabajan para la empresa monopolística, ya que significa mayor estabilidad en el empleo 

¿Resultado? las telecos siempre fueron un enorme empleador local, algo que como te puedes imaginar siempre fue bien visto por cualquier gobierno. A pesar de todo lo que ha llovido, desde Internet y la telefonía móvil en adelante, este sector empleaba a 4,7 millones de personas en todo el mundo en el 2022

Pero desde al menos el 2018 las telecos están inmersas en una progresiva reducción de empleados, por un cumulo de razones entre la cuales: el cambio de modelo de negocio (no necesito ya a estos empleados con estas habilidades), los altos costes laborales que soportan y el proceso irreversible de automatización que afecta a todos los sectores 

Aunque ahora, lógicamente, esta de moda achacar a la IA la responsabilidad por la perdida de empleo, lo cierto es IA, con el adjetivo previo que quieras ponerle, es parte de una tendencia más larga que incluye una búsqueda de mayor eficiencia, productividad y por supuesto la automatización

En un más que reciente caso la CEO de BT, Allison Kirkby, señala que la IA podría acelerar el objetivo de reducir los costes laborales en la empresa, lo que en significa reducir 40.000 empleos los próximos 5 años 

Para entender esto más allá del titular llamativo, hay que pensar en la IA, al menos en este caso, como una de las soluciones para reducir los altos costes laborales en el sector , que en el particular caso de BT suponen más de 31% del gasto operacional (OPEX), en un sector donde este coste suele ser superior al CAPEX

Esto nos ayuda a entender la IA como una fase en la automatización de procesos y tareas que como siempre desplaza, destruye y crea empleos ,,,