Traduce le parole in musica l’intelligenza artificiale di Meta, si chiama MusicGen

Meta lancia un generatore di musica basato sull’intelligenza artificiale. Dei chiama MusicGen. A differenza di Google, lo ha reso open source. Il codice sorgente è disponibile a questo indirizzo.

Meta afferma che MusicGen è stato addestrato su 20.000 ore di musica, inclusi 10.000 brani musicali con licenza “di alta qualità” e 390.000 brani solo per strumenti da ShutterStock e Pond5, una grande libreria multimediale di stock. La società non ha fornito il codice utilizzato per addestrare il modello, ma ha reso disponibili modelli pre-addestrati che chiunque abbia l’hardware giusto.

Felix Kreuk, ingegnere di ricerca parte del team di sviluppo, ha mostrato le capacità di MusicGen in una conversazione su Twitter, evidenziando come il sistema possa non solo generare musica dal testo ma anche da una traccia esistente, per prenderla come esempio e sviluppare nuove melodie. I ricercatori di Meta ricordano in un post ufficiale sul blog dell’iniziativa che tutta la musica su cui è basato il modello è coperta da accordi legali con i titolari dei diritti.

Tra questi c’è anche il sito Shutterstock, una piattaforma con sede a New York, che fornisce contenuti fotografici, filmati di repertorio, musica e strumenti di editing. Nel recente passato, proprio Shutterstock ha firmato un accordo con OpenAI per concedere parte del proprio archivio gratuito come palestra di “allenamento” degli algoritmi. Dal 2022, il servizio ha lanciato un proprio strumento di generazione di immagini, che compete con Image Creator di Microsoft Bing e il famoso Midjourney.

Il modello è disponibile in diverse versioni, da 300 milioni di parametri, 1,5 miliardi di parametri o 3,3 miliardi di parametri, ma secondo gli autori dello studio, nelle prove di ascolto la musica prodotta dalla versione da 300 milioni di parametri è quella che è stata apprezzata di più dagli utenti, anche se il modello più grande è quello in grado di riprodurre una migliore qualità del suono e una maggiore aderenza al prompt iniziale. Il progetto è solo all’inizio, ma secondo lo studio è in grado di offrire una qualità superiore ad altre soluzioni analoghe.

Leggi le ultime news su: https://w3b.today

Può interessarti anche:  Musica prodotta dall’intelligenza artificiale: di chi sono i diritti?

Seguici su Telegram https://t.me/presskit

Seguici su Facebook https://www.facebook.com/presskit.it

Related Posts