“Per creare un romanzo o un dipinto, un artista fa delle scelte che sono fondamentalmente estranee all’intelligenza artificiale”, Ted Chiang

“L’intelligenza artificiale non creerà arte”, denuncia l’autore di racconti di fantascienza Ted Chiang. “Per creare un romanzo o un dipinto, un artista fa delle scelte che sono fondamentalmente estranee all’intelligenza artificiale.

Al momento, la narrativa generata da grandi modelli linguistici come ChatGPT è terribile.

Le aziende che promuovono l’intelligenza artificiale generativa i programmi affermano che scateneranno la creatività. In sostanza, stanno dicendo che l’arte può essere tutta ispirazione e niente sudore, ma queste cose non possono essere facilmente separate. Non sto dicendo che l’arte debba comportare noia. Ciò che sto dicendo è che l’arte richiede di fare scelte a ogni scala; le innumerevoli scelte su piccola scala fatte durante l’implementazione sono importanti per il prodotto finale tanto quanto le poche scelte su larga scala fatte durante la concezione. È un errore equiparare “su larga scala” a “importante” quando si tratta delle scelte fatte durante la creazione artistica; l’interrelazione tra la grande scala e la piccola scala è dove risiede l’arte.

L’arte è notoriamente difficile da definire, così come lo sono le differenze tra buona arte e cattiva arte. Ma lasciatemi fare una generalizzazione: l’arte è qualcosa che deriva dal fare molte scelte. Questo potrebbe essere più facile da spiegare se usiamo la scrittura di narrativa come esempio. Quando scrivi narrativa, stai – consapevolmente o inconsapevolmente – facendo una scelta su quasi ogni parola che digiti; per semplificare, possiamo immaginare che un racconto di diecimila parole richieda qualcosa nell’ordine di diecimila scelte. Quando dai un prompt a un programma di intelligenza artificiale generativa, stai facendo pochissime scelte; se fornisci un prompt di cento parole, hai fatto circa cento scelte.

Se un’intelligenza artificiale genera un racconto di diecimila parole in base al tuo prompt, deve sostituire tutte le scelte che non stai facendo. Ci sono vari modi in cui può farlo. Uno è prendere una media delle scelte che altri scrittori hanno fatto, come rappresentato dal testo trovato su Internet; quella media equivale alle scelte meno interessanti possibili, motivo per cui il testo generato dall’intelligenza artificiale è spesso molto insipido. Un altro è istruire il programma a impegnarsi in un’imitazione dello stile, emulando le scelte fatte da uno scrittore specifico, il che produce una storia altamente derivativa. In nessuno dei due casi si crea un’arte interessante.

Penso che lo stesso principio di base si applichi all’arte visiva, sebbene sia più difficile quantificare le scelte che un pittore potrebbe fare. I dipinti reali portano il segno di un numero enorme di decisioni. Al confronto, una persona che utilizza un programma di conversione testo-immagine come dall-e inserisce un prompt come “Un cavaliere in armatura combatte un drago sputafuoco” e lascia che il programma faccia il resto. (La versione più recente di dall-e accetta prompt fino a quattromila caratteri, centinaia di parole, ma non abbastanza per descrivere ogni dettaglio di una scena.) La maggior parte delle scelte nell’immagine risultante devono essere prese in prestito da dipinti simili trovati online; l’immagine potrebbe essere resa in modo squisito, ma la persona che inserisce il prompt non può rivendicarne il merito.

Alcuni commentatori immaginano che i generatori di immagini influenzeranno la cultura visiva tanto quanto l’avvento della fotografia in passato. Sebbene questo possa sembrare superficialmente plausibile, l’idea che la fotografia sia simile all’intelligenza artificiale generativa merita un esame più approfondito. Quando la fotografia è stata sviluppata per la prima volta, sospetto che non sembrasse un mezzo artistico perché non era evidente che ci fossero molte scelte da fare; bastava impostare la macchina fotografica e avviare l’esposizione. Ma col tempo le persone si sono rese conto che c’erano un gran numero di cose che si potevano fare con le macchine fotografiche e che l’arte risiede nelle numerose scelte che un fotografo fa. Potrebbe non essere sempre facile articolare quali siano le scelte, ma quando si confrontano le foto di un dilettante con quelle di un professionista, si può vedere la differenza. Quindi la domanda diventa: esiste un’opportunità simile per fare un gran numero di scelte usando un generatore di testo in immagini? Penso che la risposta sia no. Un artista, che lavori in digitale o con la pittura, prende implicitamente molte più decisioni durante il processo di creazione di un dipinto di quante ne basterebbero in un prompt di testo di poche centinaia di parole.

Possiamo immaginare un generatore di testo in immagini che, nel corso di qualsiasi sessione, ti consente di inserire decine di migliaia di parole nella sua casella di testo per abilitare un controllo estremamente dettagliato sull’immagine che stai producendo; questo sarebbe qualcosa di analogo a Photoshop con un’interfaccia puramente testuale. Direi che una persona potrebbe usare un programma del genere e meritare comunque di essere definita un’artista. Il regista Bennett Miller ha usato dall-e 2 per generare alcune immagini molto sorprendenti che sono state esposte alla galleria Gagosian; per crearle, ha elaborato prompt di testo dettagliati e poi ha incaricato dall-e di rivedere e manipolare le immagini generate più e più volte. Ha generato più di centomila immagini per arrivare alle venti immagini nella mostra. Ma ha detto che non è stato in grado di ottenere risultati comparabili nelle versioni successive di dall-e. Sospetto che ciò potrebbe essere dovuto al fatto che Miller stava usando dall-e per qualcosa che non è destinato a fare; è come se avesse hackerato Microsoft Paint per farlo comportare come Photoshop, ma non appena è stata rilasciata una nuova versione di Paint, i suoi hack hanno smesso di funzionare. OpenAI probabilmente non sta cercando di creare un prodotto per servire utenti come Miller, perché un prodotto che richiede a un utente di lavorare per mesi per creare un’immagine non è attraente per un vasto pubblico. L’azienda vuole offrire un prodotto che generi immagini con poco sforzo.

È più difficile immaginare un programma che, in molte sessioni, ti aiuti a scrivere un buon romanzo. Questo ipotetico programma di scrittura potrebbe richiedere di inserire centomila parole di prompt per generare centomila parole completamente diverse che compongono il romanzo che stai immaginando. Non mi è chiaro come sarebbe un programma del genere. Teoricamente, se un programma del genere esistesse, l’utente potrebbe forse meritare di essere chiamato autore. Ma, ancora una volta, non credo che aziende come OpenAI vogliano creare versioni di ChatGPT che richiedono agli utenti lo stesso sforzo di scrivere un romanzo da zero. Il punto di forza dell’intelligenza artificiale generativa è che questi programmi generano molto di più di quanto ci metti dentro, ed è esattamente ciò che impedisce loro di essere strumenti efficaci per gli artisti.

Credere che l’ispirazione superi tutto il resto è, sospetto, un segno che qualcuno non ha familiarità con il mezzo. Sostengo che questo sia vero anche se l’obiettivo è creare intrattenimento piuttosto che arte elevata. Le persone spesso sottovalutano lo sforzo richiesto per intrattenere; un romanzo thriller potrebbe non essere all’altezza dell’ideale di libro di Kafka, un'”ascia per il mare ghiacciato dentro di noi”, ma può comunque essere finemente realizzato come un orologio svizzero. E un thriller efficace è più della sua premessa o della sua trama. Dubito che si possa sostituire ogni frase di un thriller con una semanticamente equivalente e ottenere un romanzo altrettanto divertente. Ciò significa che le sue frasi, e le scelte su piccola scala che rappresentano, contribuiscono a determinare l’efficacia del thriller.

Molti romanzieri hanno avuto l’esperienza di essere avvicinati da qualcuno convinto di avere una grande idea per un romanzo, che sono disposti a condividere in cambio di una divisione al 50% dei proventi. Una persona del genere rivela inavvertitamente di pensare che formulare frasi sia un fastidio piuttosto che una parte fondamentale della narrazione in prosa. L’intelligenza artificiale generativa attrae le persone che pensano di potersi esprimere in un mezzo senza effettivamente lavorarci. Ma i creatori di romanzi, dipinti e film tradizionali sono attratti da queste forme d’arte perché vedono il potenziale espressivo unico che ogni mezzo offre. È la loro voglia di sfruttare appieno queste potenzialità che rende il loro lavoro soddisfacente, sia come intrattenimento che come arte.

Qualsiasi scritto che meriti la tua attenzione come lettore è il risultato dello sforzo profuso dalla persona che lo ha scritto. Lo sforzo durante il processo di scrittura non garantisce che il prodotto finale valga la pena di essere letto, ma non si può fare un lavoro degno di nota senza di esso. Il tipo di attenzione che presti quando leggi un’e-mail personale è diverso dal tipo si paga quando si legge un report aziendale, ma in entrambi i casi è giustificato solo quando lo scrittore ci ha pensato un po’.

Non tutti gli scritti devono essere creativi, sentiti o anche particolarmente buoni; a volte devono semplicemente esistere. Tali scritti potrebbero supportare altri obiettivi, come attrarre visualizzazioni per la pubblicità o soddisfare requisiti burocratici. Quando le persone sono tenute a produrre tale testo, difficilmente possiamo biasimarle per aver utilizzato qualsiasi strumento disponibile per accelerare il processo. Ma il mondo sta meglio con più documenti su cui è stato speso uno sforzo minimo? Sarebbe irrealistico affermare che se ci rifiutiamo di utilizzare modelli linguistici di grandi dimensioni, i requisiti per creare testo di bassa qualità scompariranno. Tuttavia, penso che sia inevitabile che più utilizziamo modelli linguistici di grandi dimensioni per soddisfare tali requisiti, più grandi diventeranno alla fine. Stiamo entrando in un’era in cui qualcuno potrebbe utilizzare un modello linguistico di grandi dimensioni per generare un documento da un elenco puntato e inviarlo a una persona che utilizzerà un modello linguistico di grandi dimensioni per condensare tale documento in un elenco puntato. Qualcuno può seriamente sostenere che questo sia un miglioramento?”

Fonte

Le opinioni espresse in questo articolo sono dell’autore.

Leggi le ultime notizie su www.presskit.it

Per non dimenticare: Causa collettiva di tre autori contro Anthropic per violazione del diritto d’aurore nell’addestramento della sua intelligenza artificiale

Seguici su Facebook https://www.facebook.com/presskit.it

Seguici su Sfero: https://sfero.me/users/presskit-quotidiano-on-line

Seguici su Telegram https://t.me/presskit

Copiate l’articolo, se volete, vi chiediamo solo di mettere un link al pezzo originale.

Related Posts