MODELLI DI SAPIENZA

Ogni epoca ha riverito un certo modello di sapiente, e ha interpretato il suo stile di vita, il suo metodo di veridizione, persino i suoi gesti, come un’incarnazione della conoscenza. Gli sciamani nella lunga fase che precede la scrittura, il filosofo nel mondo classico, il monaco nel Medioevo, il fisico dell’età moderna, hanno interpretato questo ruolo. Se si dà retta a un’intervista rilasciata da Ilya Sutskever a Jensen Huang, il sapiente dei nostri giorni sembra coincidere con il detective o il commissario di polizia dei romanzi gialli. La verità precipita nell’istante in cui l’investigatore riunisce i sospettati nella scena finale della storia, e svela l’identità dell’assassino. L’illuminazione coincide con il momento esatto in cui viene pronunciato il nome del criminale, perché la conoscenza non esiste fino a un attimo prima, e non sarebbe apparsa senza la performance discorsiva del protagonista.

Per quanto questo inquadramento del sapere contemporaneo possa sembrare curioso, non può essere sottovalutato né stimato come una farsa, dal momento che Ilya Sutskever è uno dei soci fondatori di OpenAI e il padre tecnologico di ChatGPT, mentre Jensen Huang è uno dei soci fondatori e il CEO di Nvidia, la società più capitalizzata del mondo, e la principale produttrice dei processori per i server dei software di intelligenza artificiale. La loro conversazione prende in esame alcuni passaggi storici dell’evoluzione del deep learning, e i successi degli ultimi anni vengono citati come prove di correttezza per gli assunti da cui il lavoro sulle reti neurali è partito – molto in sordina – alcuni decenni fa: il postulato che questa tecnologia riproduca il funzionamento di base del cervello umano, e rispecchi quindi la struttura materiale della mente. Sutskever, come il suo maestro e premio Nobel per la fisica Geoffry Hinton, è convinto che la realizzazione di un’Intelligenza Artificiale Generale (AGI) sia raggiungibile, e forse non sia nemmeno troppo distante. L’analogia tra le reti neurali e il funzionamento del sistema nervoso centrale fornirebbe una prova a favore di questa tesi, e il livello delle prestazioni raggiunto dalle AI generative trasformative, come ChatGPT, conferma questa suggestione. Vale la pena di approfondire allora in che modo si comporterebbe l’intelligenza umana che Sutskever propone come modello per l’AGI, e in che modo il software di OpenAI la starebbe emulando. Dopo mezz’oretta di chiacchiere Huang e il suo interlocutore arrivano al punto, evocando il fantasma dell’investigatore nei romanzi gialli.

PREDIZIONI LESSICALI

Il discorso dell’ispettore deve permetterci di comprendere anche il modo in cui afferra la verità Newton nel suo laboratorio di fisica, Tommaso d’Aquino nello sviluppo di una questio, o chiunque di noi mentre risponde ad una mail di lavoro.

Nelle battute precedenti dell’intervista, Sutskever chiarisce i principi del funzionamento di ChatGPT e delle altre intelligenze artificiali generative trasformative. Gli zettabyte di dati disponibili online confezionano un archivio di testi per il training delle reti neurali, che agevola il loro compito di individuare le correlazione tra i vocaboli: durante una vita intera, ognuno di noi entra in contatto con circa un miliardo di parole, mentre il volume di quelle censite nelle banche dati delle AI è di un ordine di decine di migliaia maggiore. Lo scopo di questo lavoro del software è identificare lo spazio semantico di ogni lemma, classificandolo sulla base delle «compagnie che frequenta»: per esempio, in italiano la parola |finestra| appare con maggiore probabilità accanto a |casa| e a |porta|; con probabilità di due terzi inferiore occorre accanto a |tempo|, che figura comunque con il doppio della probabilità di |programma|, a sua volta due volte più probabile di |applicazione| e di |giorni|. La frequenza dei termini che si succedono a breve distanza nelle stesse frasi insegnano che |finestra| può riferirsi a un elemento architettonico, a un ambiente di interazione informatico, a un periodo cronologico. Un esame ricorsivo su ciascuna parola permette di ricavare un modello di calcolo che assegna ogni termine ad una famiglia di probabilità di apparizione accanto ad altri lemmi: ogni contesto lessicale viene rappresentato da un vettore nello spazio multidimensionale, che analizza le modalità con cui la parola è stata applicata nei testi dell’archivio.

Quando il software dialoga con l’utente umano, la mappatura delle correlazioni che governano le possibili occorrenze delle parole diventa la matrice da cui viene derivata la composizione delle frasi e del testo generato dall’AI. Sutskever rivendica con fierezza il miglioramento della capacità di ChatGPT-4, rispetto alle versioni precedenti, di predire con correttezza quale debba essere il termine da stampare dopo quello appena scritto. Il compito che viene eseguito dal programma, ogni volta che interagisce con il prompt dell’utente, è partire dalle parole che l’essere umano ha imputato nella domanda e calcolare, uno dopo l’altro, quali sono i vocaboli che deve allineare nelle proposizioni che costituiscono la risposta.

L’immagine dell’intelligenza che viene restituita da questa descrizione somiglia in modo preoccupante a quella di un «pappagallo stocastico», un ripetitore meccanico di termini appresi a memoria, senza alcuna idea di cosa stia dicendo. Ma questo ritratto contrasta sia con il vaticinio di un avvento prossimo dell’AGI, sia con il programma di una migliore comprensione del funzionamento della mente umana, che si trova alla base della carriera di Sutskever fin dagli esordi in Europa. Il modello dell’ispettore e dell’agnizione del colpevole al termine della sua ricostruzione dei fatti e delle testimonianze serve ad aggirare questo fastidio. Il discorso conclusivo dell’investigatore deve convergere verso la predizione di una parola, che si trova alla fine della sua dissertazione, e deve coincidere con il nome del vero assassino.

COS’È LA VERITÀ

Nell’argomentazione dell’ispettore la parola conclusiva è un enunciato che racchiude, nel riferimento ad uno specifico individuo, un intero orizzonte di verità, in cui si svela l’autentico significato di relazioni personali, di comportamenti, di dichiarazioni precedenti, di indizi reali e presunti. In questa eccezionalità si racchiude la suggestione del modello evocato da Sutskever, che nella predizione di un solo nome concentra una storia intera, insieme al successo del metodo empirico di inadagine, e a quello della corrispondenza tra linguaggio e realtà. Dal suo punto di vista il tipo di conoscenza, che si dispiega nella sequenza di parole con cui si raggiunge l’enunciazione del nome dell’assassino, equivale alla forma piena del sapere che può essere elaborata e conquistata dagli esseri umani, dagli anonimi sciamani nelle caverne di Lescaux a Platone, a Tommaso d’Aquino, a Newton. ChatGPT predice di volta in volta la parola che deve occorrere dopo quella appena stampata, come l’investigtore arriva a pronunciare il nome dell’assassino – e questo è tutto quello che si può dire dal punto di vista scientifico e tecnologico sull’intelligenza.

Ho già discusso qui il sospetto che la rete neurale, (in cui ogni unità di calcolo entra in competizione con tutte le altre nella sua conoscenza limitata, e in cui solo il sistema nella sua totalità può disporre di un sapere completo sulla realtà) sia la rappresentazione della struttura neoliberista della società in cui vengono progettati questi dispositivi, più che una proiezione della struttura cerebrale: non insisto quindi su questo tema.

Per quanto riguarda la teoria della verità e la teoria del linguaggio sottesa alle convinzioni di Sutskever, è opportuno che chi è stato battezzato con un nome toccato in sorte di frequente ad assassini e delinquenti di vario genere, provveda a modificare la propria identità all’anagrafe, o ad allestire manovre di sabotaggio preventive, perché i detective artificiali mostreranno una certa inclinazione a imputargli ogni genere di crimini. Pregiudizi in fondo non molto differenti hanno contribuito, con giudici e agenti di polizia umani, a riempire le carceri americane di detenuti neri.

Ironie a parte, è curioso constatare la svolta epistemologica in corso negli ambienti tecnologici di chi si occupa di scienze della mente. Dopo decenni di stretta osservanza chomskyana, per cui i principi del linguaggio sarebbero cablati nel cervello e sarebbero quindi uguali per tutti gli esseri umani, la passione per l’AGI sta risvegliando l’interesse per la cosiddetta «ipotesi Sapir-Whorf» (2), con un’interpretazione molto più radicale di quella cui avrebbero assentito i due linguisti eponimi. Per Edward Sapir e Benjamin Lee Whorf la percezione della realtà e il pensiero vengono informati dalle categorie grammaticali e semantiche della lingua parlata dalla comunità; ma la tesi sostenuta da Sutskever (e di fatto condivisa da tutti coloro che riconoscono in ChatGPT l’imminenza dell’AGI) è che la distribuzione statistica delle parole, e la loro linearizzazione in un discorso, esauriscano tutto quello che possiamo sapere sull’intelligenza. La macchina del linguaggio, con la sua struttura sintattica, ma soprattutto con l’archivio dei testi depositati nella tradizione storica, è il dispositivo che produce la nostra percezione della realtà e che genera ogni nuovo enunciato sulla verità, dagli imbonitori nei mercati rionali ai paper dei premi Nobel.

La metafora dell’investigatore chiarisce che il meccanismo funziona solo entro il perimetro di vincoli piuttosto rigidi. Il poliziesco è un genere letterario con assiomi ontologici forti, che includono categorie prive di ambiguità – vittima, colpevole, movente, arma, esecuzione, complice, ispettore, sospettati, innocenti, testimonianze, indizi, prove, spiegazione razionale. Il conflitto di classe, il dibattito sul sistema penale, il rapporto tra potere e scienza, il concetto di individualità, di responsabilità, di causalità, sono tutti elementi che ricadono al di fuori del contratto enunciativo che si stabilisce tra narratore e lettore. Allo stesso modo, nel quadro teoretico che sostiene la tesi di Sutskever, la possibilità che l’intelligenza si interroghi sulle premesse e sugli obiettivi dei problemi è esclusa, a vantaggio di una visione puramente strumentale del pensiero: il processo razionale deve individuare i mezzi per raggiungere l’obiettivo (nella metafora, per smascherare l’assassino), senza domandarsi quali sono le ragioni per farlo, o la validità dell’obiettivo, o chiedersi se esista davvero l’assassino e se sia uno solo, se la responsabilità non debba essere distribuita in modo diverso da quello che impone la tradizione.

La tradizione del corpus storico dei testi apre e chiude la possibilità stessa della veridizione, del pensiero, dell’intelligenza: la combinatoria messa in opera dalla macchina statistica che (secondo Sutskever) è il linguaggio non può, e non deve, coniare nuovi significati per vecchi significanti, cercare nuove espressioni per interpretare la società e la realtà attuali. La riproduzione è il senso della generazione, e non ci sono vie d’uscita al labirinto dell’infinita ricombinazione delle parole che significano sempre le stesse cose.

È questa l’intelligenza che vogliamo?

 

RIFERIMENTI BIBLIOGRAFICI

  1. Fireside Chat with Ilya Sutskever and Jensen Huang: AI Today and Vision of the Future, Nvidia, 22 marzo 2023, ora disponibile alla url: https://www.nvidia.com/en-us/on-demand/session/gtcspring23-s52092.
  2. Cfr. in particolare Benjamin Lee Whorf, Linguaggio, pensiero e realtà, tr. It. a cura di Francesco Ciafaloni, Bollati Boringhieri, Torino 2018.

Autore

  • Si occupa di media digitali dal 1999: è co-fondatore di Pquod e VentunoLab, società specializzate nella comunicazione web e nell’analisi di dati. Ha svolto attività di docenza per il Politecnico di Milano e l’Università degli Studi di Milano. Dal 2011 pubblica sulle testate Linkiesta, pagina99, Gli Stati Generali. È il direttore responsabile di Controversie. Per le pubblicazioni: https://scholar.google.com/citations?hl=it&user=zSiJu3IAAAAJ

    Leggi tutti gli articoli