Meta lanza AudioCraft: ¿cómo funciona el nuevo generador de música AI de código abierto?

Con el lanzamiento de AudioCraft, Meta refrenda sus intenciones de hacer de la inteligencia artificial el nuevo motor de su negocio.

Getty Images

Meta anunció el lanzamiento de AudioCraft, un nuevo conjunto de modelos de lenguaje basados en inteligencia artificial capaces de generar contenidos de audio en respuesta a un prompt de texto. “La familia de modelos AudioCraft es capaz de producir audio de alta calidad con consistencia a largo plazo y son fáciles de usar. Con AudioCraft, simplificamos el diseño general de modelos generativos para audio”, afirmó la compañía en un comunicado de prensa.

AudioCraft consta de tres modelos: Music Gen que fue entrenado con música propiedad de Meta y con licencia específica; AudioGen adiestrado con efectos de sonido públicos y EnCodec, una herramienta de compresión de audio basada en IA. Las dos primeras opciones tienen la capacidad de generar clips musicales a partir de indicaciones de texto.

Los códigos de los tres modelos IA ya están disponibles para su descarga desde Hugging Face y la página de Github de la empresa. Toda la familia de AudioCraft fue lanzada bajo una licencia de libre distribución. Según la compañía, los modelos han sido diseñados específicamente para artistas musicales y diseñadores de sonido para “proporcionar inspiración”.

¿Cómo funciona AudiCraft de Meta?

Meta puso a disposición de los interesados un demo de cada uno de los modelos de AudioCraft a través de Hugging Face. Para obtener un clip musical, los usuarios deberán ingresar en la ventana dedicada una breve descripción del tipo de pieza que pretenden obtener.

Es recomendable agregar detalles como el tiempo, género o tipo de instrumentos preferidos para obtener mejores resultados. De manera opcional, los usuarios pueden acompañar el prompt con un archivo de audio pregrabado o, bien, con una grabación nueva desde el micrófono del dispositivo.

Al dar clic en el botón Generate, la plataforma entregará una pista de audio de 12 segundos. El material puede ser ajustado a través de nuevas indicaciones de texto. Los clips pueden descargarse para compartirse en diferentes plataformas. Con el lanzamiento de AudioCraft, Meta refrenda sus intención por hacer de la IA el nuevo motor de su negocio. Aunque la apuesta no tendrá resultados inmediatos, si promete grandes rendimientos en el mediano y largo plazo.

La estrategia de Meta tiene la capacidad de cambiar las reglas del mercado. La compañía tiene los recursos para lanzar decenas de modelos IA en una fase de desarrollo temprana a bajo costo. Al compartir el código de los desarrollos, las mejoras a sus herramientas IA llegan solas para, en una etapa final, convertirlas en un nuevo producto o en una función para el ecosistema de Meta con todas las condiciones para generar ingresos.

Una estructura interna más pequeña, la colaboración de la comunidad científica y de investigación, así como cooperación con los desarrolladores independientes para perfeccionar sus desarrollos IA son acciones que configuran una ruta para descubrir y captar nuevos talentos. Con ello, busca trazar una línea de negocio más rentable que el Metaverso, o bien, una que permita transformarlo. De esta manera, Meta pretende competir contra sus robustos rivales.

Wired