Giacomo Miceli mette alla prova l’intelligenza artificiale, facendogli produrre un dialogo immaginario quasi infinito tra il regista Werner Herzog e il filosofo Slavoj Žižek. Il risultato: “Ho costruito questa conversazione come avvertimento, spiega su Scientific America. “I miglioramenti in quello che viene chiamato apprendimento automatico hanno reso i deepfake (immagini, video o discorsi incredibilmente realistici ma falsi) troppo facili da creare e la loro qualità troppo buona. Allo stesso tempo, l’intelligenza artificiale che genera il linguaggio può sfornare in modo rapido ed economico grandi quantità di testo. Insieme, queste tecnologie possono fare molto di più che mettere in scena una conversazione infinita. Hanno la capacità di annegarci in un oceano di disinformazione”.
“Se queste chiacchiere generate dall’intelligenza artificiale sembrano plausibili, immagina i discorsi dal suono realistico che potrebbero essere usati per offuscare la reputazione dei politici, truffare i leader aziendali o semplicemente distrarre le persone con disinformazione che suona come notizie riportate dall’uomo”.
“I deepfake sono diventati troppo buoni e troppo facili da realizzare; proprio questo mese, Microsoft ha annunciato un nuovo strumento di sintesi vocale chiamato VALL-E che, affermano i ricercatori, può imitare qualsiasi voce sulla base di soli tre secondi di audio registrato. Stiamo per affrontare una crisi di fiducia e ne siamo del tutto impreparati”.
“Per sottolineare la capacità di questa tecnologia di produrre grandi quantità di disinformazione, ho optato per l’idea di una conversazione senza fine. Avevo solo bisogno di un grande modello linguistico, messo a punto sui testi scritti da ciascuno dei due partecipanti, e un semplice programma per controllare l’andirivieni della conversazione, in modo che il suo flusso risultasse naturale e credibile. Fondamentalmente, i modelli linguistici prevedono la parola successiva in una sequenza, data una serie di parole già presenti. Mettendo a punto un modello linguistico, è possibile replicare lo stile e i concetti di cui è probabile che parli una persona specifica, a condizione che si disponga di abbondanti trascrizioni di conversazioni per quell’individuo. Ho deciso di utilizzare uno dei principali modelli di linguaggio commerciale disponibili. È stato allora che mi sono reso conto che è già possibile generare un finto dialogo, inclusa la sua forma vocale sintetica, in meno tempo di quello necessario per ascoltarlo. Questo mi ha fornito un nome ovvio per il progetto: Infinite Conversation”.
La discussione creata
“Una volta che tutti i pezzi sono andati a posto, mi sono meravigliato di qualcosa che non mi era venuto in mente quando ho iniziato il progetto. Come i loro personaggi della vita reale, le mie versioni chatbot di Herzog e Žižek conversano spesso su argomenti di filosofia ed estetica.
La loro discussione è avvincente, in parte, perché questi intellettuali hanno accenti distintivi quando parlano inglese, per non parlare della tendenza a scelte di parole eccentriche. Ma hanno qualcos’altro in comune: entrambe le voci sono deepfake e il testo che pronunciano con quegli accenti distintivi è generato dall’intelligenza artificiale.
A causa della natura esoterica di questi argomenti, l’ascoltatore può temporaneamente ignorare le sciocchezze occasionali che il modello genera. Ad esempio, la visione di AI Žižek di Alfred Hitchcock alterna tra vedere il famoso regista come un genio e come un cinico manipolatore; in un’altra incoerenza, il vero Herzog odia notoriamente i polli, ma il suo imitatore di intelligenza artificiale a volte parla degli uccelli con compassione. Poiché l’attuale filosofia postmoderna può essere letta come confusa, un problema notato dallo stesso Žižek, la mancanza di chiarezza nella Conversazione infinita può essere interpretata come profonda ambiguità piuttosto che contraddizioni impossibili.
Come ha fatto
“Infinite Conversation è iniziato quando mi sono imbattuto in un programma di sintesi vocale esemplare chiamato Coqui TTS. Molti progetti nel dominio digitale iniziano con la ricerca di una libreria software precedentemente sconosciuta o di un programma open source. Quando ho scoperto questo kit di strumenti, accompagnato da una fiorente comunità di utenti e da un’abbondante documentazione, sapevo di avere tutti gli ingredienti necessari per clonare una voce famosa.
Costruire un training set per clonare la voce di Herzog è stata la parte più semplice del processo. Tra le sue interviste, le voci fuori campo e il lavoro sugli audiolibri, ci sono letteralmente centinaia di ore di discorso che possono essere raccolte per addestrare un modello di apprendimento automatico o, nel mio caso, perfezionarne uno esistente. L’output di un algoritmo di apprendimento automatico generalmente migliora in “epoche”, che sono cicli attraverso i quali la rete neurale viene addestrata con tutti i dati di addestramento. L’algoritmo può quindi campionare i risultati alla fine di ogni epoca, fornendo al ricercatore materiale da rivedere per valutare l’andamento del programma. Con la voce sintetica di Werner Herzog, ascoltare il modello migliorare ad ogni epoca è stato come assistere a una nascita metaforica, con la sua voce che prendeva gradualmente vita nel regno digitale.
Una volta ottenuta una voce Herzog soddisfacente, ho iniziato a lavorare su una seconda voce e ho scelto intuitivamente Slavoj Žižek”.
Poi è passato all’apprendimento automatico, “una tecnica di intelligenza artificiale che utilizza grandi quantità di dati per “addestrare” un algoritmo a migliorare mentre esegue ripetutamente un determinato compito, sta attraversando una fase di rapida crescita”.
Così è nato Infinite Conversation.
Per sentire il dialogo andate qui: https://infiniteconversation.com/
Leggi le ultime news su: https://w3b.today
Può interessarti anche: Apple con l’intelligenza artificiale leggerà i libri, che diventeranno, così audiolibri
Seguici su Telegram https://t.me/presskit