Latent-SR: Cómo agrandar imágenes sin perder calidad con inteligencia artificial

Demanda mucha paciencia, pero sus resultados son excelentes.

Uno de los aspectos más positivos de la «explosión algorítmica» es el acceso a nuevas aplicaciones que nos permiten agrandar imágenes sin perder calidad. Previamente hemos hablado sobre Waifu2x-ncnn-Vulkan GUI Edition ReloadedReal-ESRGAN-GUI y AI Image Upscaler, todos ellos con diferentes modelos y parámetros avanzados. Sin embargo, el proyecto Latent-SR se suma a esta lista ofreciendo una versión web de Latent Diffusion Super Resolution, uno de los upscalers más potentes.

Agrandar imágenes es un proceso sencillo, pero obtener buenos resultados es una historia completamente diferente. Cada imagen presenta sus propios desafíos, y en más de una ocasión encontramos herramientas que favorecen a un tipo específico de contenido. Por ejemplo, sabemos muy bien que Waifu2x prefiere imágenes de manga y anime, pero si se trata de fotografías, no es la mejor opción. Algo similar sucede con el pixel art: Un algoritmo demasiado agresivo suele destruir el detalle, pero si mantenemos las dimensiones correctas, una pizca de «nearest neighbor» es más que suficiente.

Gracias al desarrollo de Stable Diffusion y otros modelos similares, hoy tenemos acceso a uno de los upscalers más robustos del mercado, que es Latent Diffusion Super Resolution o LDSR. Cualquier usuario interesado en usar LDSR localmente puede instalar Stable Diffusion y acceder a su sección de herramientas, pero si el hardware disponible es limitado, existe otro camino: Latent-SR.

Cómo agrandar imágenes con LDSR en Latent-SR

La interfaz de Latent-SR es muy simple

Todo lo que debemos hacer para comenzar es cargar nuestra imagen en el sitio, definir el multiplicador del upscaler, y configurar la cantidad de pasos. Esta sección es muy importante, porque de ella depende el tiempo de espera. LDSR no prioriza la velocidad: Procesar una imagen de 1024×1024 a 4x con 50 pasos tarda entre 12 y 15 minutos. Si dejamos el número de pasos en su default de 100, la espera se extiende a 25 minutos.

Podemos observar el progreso del upscaling en una pequeña ventana de terminal

Aún así, esa demora definitivamente vale la pena. Por experiencia propia puedo agregar que LDSR funciona mejor conservando el multiplicador de 4x, pero los 100 pasos de fábrica suelen ser innecesarios. Latent-SR presenta la evolución del upscaling en la sección derecha de la interfaz, y una vez finalizado podemos compartir la imagen en línea, o descargar una copia en formato PNG.

La imagen original a 1024 x 1024 píxeles

La misma imagen en 4096 x 4096, con downscale posterior a 2560 x 2560

El único detalle que queda por mencionar de Latent-SR es… su precio. Al igual que sucede con otras herramientas online que usan inteligencia artificial, Latent-SR concede una cantidad limitada de usos gratuitos, y luego nos invita a entrar en una de cuatro suscripciones: CPU, Nvidia T4, Nvidia A100 40 GB, y Nvidia A100 80 GB. Los precios oscilan entre 0.01 y 0.19 dólares por minuto de procesamiento.

Sitio oficial: Haz clic aquí

Neoteo