Su chat bot senzienti e reti neurali per usi creativi che promuovono la disoccupazione e creano lavori di merda

  • Tempo di lettura:9minuti
image_pdfimage_print

                     Prima parte

Dopo tutte le cose circolate sui giornali e sulla rete a proposito della vicenda che riguarda una AI – più precisamente una Chat bot di tipo LaMDA (Language Model for Dialogue Applications), e Blake Lemoine, l’ingegnere di Google che ha dichiarato di aver interagito con un’entità senziente – volevo dire la mia ma da un punto di vista un po’ differente. Certo affermare che una macchina è senziente è una notizia pruriginosa e accattivante, ma a me, adesso, non interessa il fatto che la macchina lo fosse o meno. Quello che forse è più importante sono invece le conseguenze del loro uso e l’impatto che queste hanno e avranno sul lavoro umano.

Quasi tutte le aziende, e in particolar modo quelle dei servizi che devono interagire con gli utenti, non hanno più uno sportello fisico; nessuno con il quale poter interagire che abbia una conoscenza tale da saper risolvere anche quei problemi atipici che i protocolli usati per automatizzare il servizio non hanno previsto. Si tratta di due operazioni caratteristiche del capitalismo della post modernità. La prima è una esternalizzazione che consiste nell’affidare il servizio di comunicazione con gli utenti a un call center – spesso ubicato in paesi a basso reddito – oppure automatizzandolo nel vero senso del termine. Anche qui la soluzione è duplice: si tenta prima, e in tutti i modi, di convogliare la domanda verso una soluzione prevista e appunto automatizzata (schiaccia il taso x) e, soltanto in ultima istanza, si potrà accedere a un dialogo con un operatore umano, oppure si dovrà interagire con una chat bot che non essendo preparata per rispondere a domande che riguardano dei casi atipici si dimostrerà essere di tutto meno che intelligente. È questo il tipo di AI che è incontreremo più probabilmente e che ha come effetto sociale la perdita del lavoro umano o la sua dequalificazione. Questo è il risultato che si ottiene con la tecnologia meravigliosa che gli sta dietro, il risultato del progresso scientifico che troppe persone pensano che partorisca strumenti neutri e che soltanto al loro cattivo uso siano da imputare le conseguenze negative. Se infatti proviamo a pensare a un buon uso di questa tecnologia, quello più carino che ci può venire in mente, è quello sul quale si basa la vicenda raccontata nel film Lei (Her) dove un utente si innamora appunto di una chat bot e dove aleggia dietro l’angolo la possibilità – anche questa raccontata da un altro film – che la chat bot sia in realtà non una macchina (un algoritmo) ma una persona in carne e ossa, sottopagata che vive da un’altra parte del mondo come i lavoratori sfruttati dalle piattaforme di crowdsourcing come il Mechanical Turk di Amazon di cui ho parlato spesso o come nel film di Pif “E noi come stronzi rimanemmo a guardare”.

LaMDA è un algoritmo che gira su una rete neurale multistrato orientato all’apprendimento del linguaggio. LaMDA non dispone di risposte predefinite nel proprio sorgente, ma genera le frasi istantaneamente, in base al modello generato dal training del Machine Learning basato sulle informazioni che gli vengono fornite. Nelle fasi di addestramento preventivo, l’algoritmo viene alimentato con una enorme quantità di testi imparando non soltanto i vari lemmi nelle varie lingue ma estraendo da essi la probabilità che a un termine ne segua un altro. Facendo così, pur non imparando il significato, contestualizza le parole ma non in base ai nostri stessi criteri ma a semplici corrispondenze probabilistiche. Lo stesso avviene per le traduzioni. Google translate non conosce nessuna lingua, calcola soltanto la probabilità che quel termine ha in una lingua di essere inserito in una sequenza e non in un’altra. L’algoritmo non smette mai di imparare, non a caso ogni volta vi chiede se avete da proporgli una traduzione migliore, se rispondete sappiate che state lavorando gratis per Google. Questo metodo risulta infatti efficiente proporzionalmente alla quantità di dati ai quali può accedere che affinano così sempre di più le sue risposte. Ma noi umani usiamo il linguaggio in una maniera non così lineare. Non c’è una corrispondenza esatta tra la voce e la scrittura. La lettura è sempre una forma di interpretazione della scrittura e questo avviene anche dopo l’introduzione della punteggiatura e di quei segni espressivi come il punto di domanda e quello esplicativo. Ma la macchina non deve capire, deve soltanto trovare delle risposte le più probabili per interagire con le domande che le avevamo posto. Anche in questo caso la macchina non darà mai una risposta desueta, creativa. Darà una risposta plausibile ma tra tutte quelle possibili sceglierà quelle che avranno più occorrenze. E qui le affermazioni di Google risultano fuorvianti: But unlike most other language models, LaMDA was trained on dialogue. During its training, it picked up on several of the nuances that distinguish open-ended conversation from other forms of language. One of those nuances is sensibleness (Ma a differenza della maggior parte degli altri modelli linguistici, LaMDA è stata addestrata al dialogo. Durante la sua formazione, ha raccolto molte delle sfumature che distinguono la conversazione aperta da altre forme di linguaggio. Una di queste sfumature è la sensibilità). Ma come si fa ad insegnare la sensibilità a un algoritmo? Non la si insegna, semplicemente. La macchina cercherà di situare le domande dentro un contesto linguistico in conseguenza del fatto che durante l’addestramento ha etichettato i dialoghi collocandoli dentro categorie e sub categorie sempre più sofisticate e tali da permettere di collocare il dialogo in corso in un contesto invece che in un altro. Si potrebbe dire che la macchina è diventata sensibile al contesto nel senso che è una operazione che la macchina fa a partire già dalle prime interazioni. Così facendo e con il procedere del dialogo la macchina affinerà sempre di più le sue risposte in maniera da riuscire a simulare una concordanza tale che queste saranno proprio quelle che probabilmente l’interrogante si aspettava.

Ritornando al call center, la macchina non sarà in grado di rispondere a tutte quelle domande non previste nella FAQ list; non risolverà mai quei problemi degli utenti che nascono da situazioni atipiche e scarsamente documentate nei pacchetti di dati usati per addestrarla. La Macchina ha creato disoccupazione o sottooccupazione e nonostante questo non è capace di rispondere adeguatamente alle domande che le poniamo. La macchina sembrerà senziente ma continuerà a non saper rispondere alla vostra domanda.

Con una tecnologia simile sono adesso disponibili a pagamento i “content-bot” dei servizi di scrittura automatica che possono essere usati sia per scrivere storie di fantasia, sia per creare dei post per dei blog. Si potrebbero anche usare per confezionare un giornale facendo a meno dei giornalisti. Basterà un abbonamento a una qualche agenzia di notizie da dare in pasto a questo tipo di AI che commenterà adeguatamente le news nello stile desiderato a una velocità impossibile per un giornalista in carne e ossa. Potranno compilare i necrologi; con in input la trama, fare le recensioni di un film o di un romanzo. Scrivere un romanzo.

Questo è un esempio di completamento del testo, questo è quello immesso nella AI:

Ecco che si fa evidente, al contrario, tutta la potenzialità simbiotica tra i due mondi. Tutte le aperture e le conquiste di un piano collaborativo che si articoli intorno alle linee di senso che gli umani possono suggerire alle macchine. 

Questo è come la AI (OpenAI) ha proseguito:

Al contrario, la mancanza di un disegno strategico da parte dei politici, l’incapacità di immaginare un futuro alternativo all’attuale modello di sviluppo sostenibile, la difficoltà a comprendere e capire le potenzialità delle nuove tecnologie che sono pronte a cambiare il nostro modo di vivere e di pensare, stanno generando un’incertezza diffusa che si traduce in una diffidenza che va oltre alla semplice reazione, che è sempre più alla ricerca di una chiara identità. Accade, quindi, che questo nuovo mondo che si sta configurando, che si sta trasformando, che si sta modificando, che è sempre più presente nella nostra vita di tutti i giorni, che è già entrato nelle nostre case, che è già entrato nelle nostre macchine, ancora non parla un linguaggio universale, ancora non parla un linguaggio che tutti possano comprendere, un linguaggio che tutti possano decodificare, ma che è soprattutto un linguaggio che può essere manipolato.

Niente male per una macchina! In maniera simile operano le tecnologie TTI (Text to image). Le serie dei ritratti nelle due immagini sotto, sono state generate da una AI in risposta a delle istruzioni verbali che io ho immesso.

Immagini create da Midjourney su input testuale di Gilberto Pierazzuoli

Il testo in input dirige l’algoritmo verso una serie di etichette che anche qui rimandano a una categorizzazione che esso ha creato a partire da miliardi di immagini contenute nel web. C’è già chi discute se le opere ottenute con questa tecnologia siano forme di arte mettendo in discussione l’autorialità di chi ha immesso l’input testuale, in definitiva dell’artista. Ovviamente è un falso problema, altrimenti ci si dovrebbero fare le stesse domande a proposito dei collage, del ready made alla Duchamp o anche dei pastiche. I problemi sono altri. I dati raccolti, in questo caso le immagini usate per addestrare l’algoritmo, di chi sono? Ci sarebbe da ripensare tutto il tema del copyright, sia per le immagini in input sia per quelle in output. Francesco d’Isa, un’artista che ha usato Midjourney per confezionare una Graphic Novel, propone la cancellazione delle leggi sul copyright e una remunerazione sociale degli artisti. Dalla parte opposta, la Getty Immages ha annunciato che vieterà il caricamento e la vendita di immagini generate utilizzando software di apprendimento automatico come DALL-E, Stable Diffusion e Midjourney. Ci troviamo di fronte a una mancanza di regolamentazione che permette alle aziende che operano nel web di appropriarsi gratuitamente dei dati e delle immagini per poi rivendere i servizi che dipendono da quei dati e da quelle immagini.

Immagini create da Midjourney su input testuale di Gilberto Pierazzuoli

Ma anche qui l’accento messo sulle creazioni artistiche, sulla loro unicità, pur nella loro riproducibilità. che si affida a forme di autenticazione NFT, che in qualche modo reificano l’immaterialità dell’opera, rendendola non tanto fruibile ma semplicemente vendibile. Così come bisognerebbe chiedersi che fine faranno gli illustratori. Probabilmente quelli più bravi e professionali rimarranno ma il resto dell’offerta di lavoro sarà probabilmente automatizzato. Un dépliant o una brochure aziendale son già oggi fattibili in poco tempo e senza avere delle competenze particolari. D’altronde, così è stato per molti altri mestieri. Il problema però consiste nel fatto che questo alleggerimento del e dal lavoro non viene giustamente distribuito creando così da una parte disoccupazione, lavoretti di ripiego per molti e arricchimento per pochi. Direi allora che le attuali dinamiche rendono sempre più urgente aprire un discorso su forme di reddito universale e incondizionato che permetta a tutti di godere delle conquiste tecnologiche. Continua…

The following two tabs change content below.

Gilberto Pierazzuoli

Attivista negli anni 70 . Trasforma l'hobby dell'enogastronomia in una professione aprendo forse il primo wine-bar d'Italia che poi si evolve in ristorante. Smette nel 2012, attualmente insegnante precario di lettere e storia in un istituto tecnico. Attivista di perUnaltracittà.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Captcha *