MusicLM: Generación de música a partir de un texto descriptivo

MusicLM es un modelo que genera música de alta fidelidad a partir de descripciones de texto, por ejemplo «una melodía relajante de violín respaldada por un riff de guitarra distorsionado». MusicLM proyecta el proceso de generación de música condicional como una tarea de modelado jerárquico de secuencia a secuencia, y genera música a 24 kHz que se mantiene constante durante varios minutos.

Los autores son Andrea Agostinelli, Timo I. Denk, Zalán Borsos, Jesse Engel, Mauro Verzetti, Antoine Caillon, Qingqing Huang, Aren Jansen, Adam Roberts, Marco Tagliasacchi, Matt Sharifi, Neil Zeghidour, Christian Frank, del equipo de Google Research.

Los experimentos realizados por los autores muestran que MusicLM supera a los sistemas anteriores tanto en calidad de audio como en adherencia a la descripción del texto. Además, demuestran que MusicLM se puede condicionar tanto en texto como en melodía, ya que puede transformar melodías silbadas y tarareadas de acuerdo con el estilo descrito en una leyenda de texto.

Para respaldar futuras investigaciones, publicaron MusicCaps, un conjunto de datos compuesto por 5.500 pares de música y texto, con descripciones de texto enriquecido proporcionadas por expertos humanos.

Vocal Remover para hacer una pista para karaoke

Vocal Remover es una aplicación en línea gratuita, que elimina las voces de una canción, creando una versión karaoke.

Una vez que elijas una canción, la inteligencia artificial separará las voces de los instrumentos. Obtendrá dos pistas: una versión de karaoke de la canción (sin voces) y una versión acapella (las voces aisladas). Se puede escuchar y descargar la canción, y poner los niveles de volumen para cada pista. El algoritmo de inteligencia artificial se denomina «Splitter AI».

Visitar el sitio de Vocal Remover.

Image Composite Editor (ICE)

Image Composite Editor (ICE) es un software avanzado para manipulación de imágenes y videos panorámicas en Windows, gratuito, creado por el Interactive Visual Media Group de Microsoft Research. Este proyecto está retirado y ya no tiene más soporte ni nuevas versiones (incluso no es fácil encontrar el instalador).

Dado un conjunto de fotografías superpuestas de una escena tomada desde una sola ubicación de cámara, la aplicación crea un panorama de alta resolución que combina a la perfección las imágenes originales.

Abajo dejo 3 muestras de lo que se puede obtener en fotos panorámicas, cada panorámica la hice a partir de la composición de 2 fotos, tomadas con un teléfono, cada una a mano alzada manteniendo el horizonte lo más estable posible.

La página oficial del proyecto está en este link.

Descargas: Versión 2.0.3 (32-bit) / Versión 2.0.3 (64-bit)

Playa y faro de José Ignacio (Uruguay) al este. Enero, 2023.
Playa de la bajada de los pescadores, al oeste del faro de José Ignacio. Enero, 2023.
Río de la Plata en Colonia mirando hacia Buenos Aires. Enero, 2023.