PORTADATECNOLOGÍA

Tócala otra vez, algoritmo: así es la carrera por recomendarte la canción perfecta

Repasamos el origen, evolución y retos pendientes de los sistemas de recomendación musical de la mano de Sergio Oramas, investigador de Pandora

Los robots lo han vuelto a hacer. Han sustituido a tu amigo, el que sabe mucho de música. O están próximos a hacerlo. El mercado de las recomendaciones musicales basadas en deep learning tiene cada vez más puntería. De dar palos de ciego basados sencillamente en el género -“si te gusta Blur, te gustará Oasis”-, hemos pasado a propuestas que se crean combinando tus gustos con los de la gente que es como tú y toman en consideración variables como el ritmo, el timbre y las letras de cada canción. “Lo que mejor funciona es el historial de cosas escuchadas, los datos demográficos no son muy importantes salvo para usuarios nuevos que no hayan escuchado nada aún”, añade Sergio Pandora, investigador de Pandora.

De acuerdo con el experto, Netflix puso la primera piedra del momento en que se encuentran ahora los sistemas de recomendación cuando organizó Netflix Prize: un premio de un millón de dólares para el equipo de desarrolladores que lograse la mejor propuesta de una herramienta de este tipo, aplicada a la selección de películas. “Esa competición hizo que se desarrollaran las tecnologías de los sistemas de recomendación que usamos ahora mismo”, señala. La aproximación actual es parecida a la que se empleaba antes, pero alcanza mucha más profundidad.

Dime qué escuchas

Los sistemas de recomendación se alimentan de tus gustos. La idea básica es que si a ti te gusta A, B y C, otro usuario con tus características podría tener las mismas preferencias. Y viceversa: si D, E y F están entre los artistas favoritos de ese otro usuario, a ti también podrían encajarte. Cuando este intercambio ocurre, por ejemplo, entre los 286 millones de usuarios activos que alcanzó Spotify en abril, las posibilidades se multiplican. “Esa inteligencia colectiva es lo que mejor funciona cuando tienes muchos usuarios”, añade el investigador. En los sistemas modernos, esa información se estructura en una matriz en la que se cruzan canciones y usuarios, y se muestra el dato de cuánto interactúa cada persona con cada tema. “Ese es el método que sigue siendo a día de hoy el que se aplica en casi todo”.

Pero este punto de partida no implica que todas las plataformas sigan el mismo camino. “Depende de los datos”, matiza Oramas. El feedback que se obtiene del usuario cambia en función de las dinámicas de cada servicio. “Spotify, por ejemplo, tiene muchas playlists que han generado los usuarios. Esos datos son muy ricos. Pandora lo que tiene son estaciones basadas en artistas o en géneros. Tú eliges un artista y el sistema te empieza a recomendar. Entonces el usuario puede dar un thumbs up a lo que le gusta. Esa información agregada a través de estaciones es muy potente”.

Dime quién eres

¿Y si no hay datos? Partir de cero no es una opción. Cuando el sistema de recomendación se enfrenta a un nuevo usuario o una nueva canción, la ausencia de historiales que puedan compararse se suple, en el caso de las personas, con datos demográficos; y en el caso de las piezas musicales, con datos asociados a estas: letras, información sobre los artistas, género, ritmos, frecuencias, armonía… En este análisis, son clave los avances del aprendizaje automático. “Si intentabas recomendar utilizando el audio antes del deep learning, funcionaba muy mal”, asegura el investigador. Antes esas variables se estudiaban por separado. Ahora existe la posibilidad de entrenar al algoritmo para que encuentre patrones de todas ellas en millones de canciones. “Eso que queda aprendido ahí, que es un poco como una caja negra, funciona bastante mejor”.

Estas recomendaciones medio ciegas también son útiles para cumplir las expectativas de usuarios que quieren salir de la burbuja y buscar sonidos nuevos en lugar de escuchar más de lo mismo, que además es lo más popular. “El sistema mejora en el sentido de que puedes recomendar más catálogo y hacer más discovery”, explica el experto. “Pero al grueso de los usuarios, que lo que le gusta son cosas que ya se han escuchado bastante en la plataforma. Con saber lo que gusta vas sobrado para la mayoría de las recomendaciones”.

Otra cosa es que estas necesidades satisfechas coincidan con las de la industria musical y, sobre todo, con las de los recién llegados a ella. “Si solo te basas en los usuarios, al final nunca vas a introducir artistas nuevos en la rueda. Hay millones de artistas underground que tienen su público potencial que les podría seguir pero no han encontrado la conexión todavía”, comenta Oramas.

Temazos o rarezas

Para las plataformas, explica el investigador, esto se presenta como una dicotomía entre explotar (exploit) y explorar (explore). Bajo el primer paradigma se recomienda lo más popular, pues es garantía de éxito. “Hay muchísimos usuarios que están contentos con eso, pero al final a la imagen de tu marca también viene bien que se descubra música. Aunque estos sean menos usuarios, a lo mejor hacen más ruido, son trendsetters”. Exploit es tu amigo fiestero recomendándote los temas que lo están petando porque seguro que te van a gustar. Explore es el amigo melómano que te pasa canciones que nunca has escuchado.

Lo importante es que el algoritmo ya está casi al nivel de una persona que te conoce. “El sistema de recomendación ha mejorado mucho en los últimos años. Pero ese componente humano del amigo que sabe mucho de música no lo puedes sustituir del todo. Todavía queda camino para mejorar”, afirma el investigador. Uno de los retos están en llegar a recomendar música de todo el catálogo, sobre la base de una profunda comprensión de las preferencias del usuario, el artista y su música. “Así podríamos realmente conectarlos a todos”.

Otro gran objetivo es meter el contexto en la ecuación. “Que se te recomiende la música según lo que estás haciendo: estudiando, corriendo, fregando…”, precisa Oramas. Lograr esto no es moco de pavo, sobre todo porque implica que la plataforma acceda de alguna manera a una información que ahora mismo está fuera de su alcance. “Mucho de esto se podría conseguir por third party data (datos de terceros), es decir, que haya otra aplicación que haya registrado tu información y luego los venda”, razona. También está la posibilidad de que sea la persona quien introduzca sus preferencias: siempre escucho rap, pero hoy no me apetece, ponme zarzuelas o quiero escuchar grabaciones acústicas. “Eso es un desafío actualmente, y se está investigando. También hay complicaciones de la interfaz y decisiones de producto que priman más otros aspectos. Pero en general, se está tomando más conciencia de la necesidad de dar más control al usuario”.

Con información de EL PAÌS

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *