NVIDIA ha revelado Fugatto, su nuevo modelo experimental de IA generativa, descrito como una “navaja suiza para el sonido”. Este modelo puede generar o modificar audio, música, voz y sonidos a partir de comandos de texto, lo que abre posibilidades para la producción musical, herramientas de aprendizaje de idiomas y desarrollo de videojuegos. Diseñado por un equipo internacional de investigadores, Fugatto destaca por sus capacidades multilingües y de múltiples acentos. Según Rafael Valle, gerente de investigación aplicada en audio de NVIDIA, el objetivo era desarrollar un modelo que comprenda y genere sonido de manera similar a los humanos.
El modelo también puede realizar tareas no contempladas durante su entrenamiento, como generar sonidos complejos y dinámicos, por ejemplo, una tormenta que evoluciona con el tiempo. Aunque NVIDIA no ha confirmado si Fugatto estará disponible para el público, su tecnología compite con otras soluciones como MusicLM de Google y el kit de sonido generativo de Meta. Con aplicaciones que abarcan desde prototipos musicales hasta personalización de sonidos en videojuegos, Fugatto promete transformar la manera en que interactuamos con el sonido y la música.