Ragionare a cuor leggero. Sulla possibilità del giudizio artificiale

Victor Colella è un uomo di novantasei anni quando si presenta davanti al giudice Frank Caprio, nel tribunale municipale di Providence, Rhode Island. L’accusa è semplice: eccesso di velocità in prossimità di una scuola. Sembra strano per una persona così anziana. Comunque, è una di quelle infrazioni che, in un sistema amministrativo ordinario, sembrano fatte apposta per essere trattate in pochi secondi. C’è una norma, un limite, una violazione. Si applica la sanzione. Poi, però, Colella risponde al giudice e spiega che guida soltanto quando è necessario e quel giorno stava accompagnando il figlio sessantatreenne, affetto da un tumore, in ospedale per esami del sangue. Frank Caprio lo guarda, si commuove, gli dice che è un brav’uomo, e archivia il caso. Il video diventa, come si usa dire, virale. Il giudice Frank Caprio, morto nel 2025, era diventato famoso proprio per questo genere di casi. Il programma Caught in Providence lo aveva trasformato in una figura globale dei social media, un giudice capace di ascoltare storie, riconoscere difficoltà delle persone e privilegiare le intuizioni morali più comuni rispetto alla freddezza della norma o, almeno, a ascoltare le storie, riconoscere le difficoltà delle persone e riportare la norma dentro la concretezza dei singoli casi.

Perché avvertiamo che Caprio è un giudice dai modi “umani”? Non semplicemente perché sembra un uomo buono. In effetti, Caprio non sospende la legge in nome della bontà. Piuttosto, interpreta la norma dentro il caso concreto. In un recente articolo su Innovation Island, Sebastiano Bavetta ha preso Macbeth come scena originaria del giudizio nell’epoca dell’intelligenza artificiale. Le streghe annunciano che il bello è brutto e il brutto è bello, che il corretto può diventare scorretto e lo scorretto può assumere la forma del corretto. Bavetta legge in questo rovesciamento una diagnosi del rischio dell’intelligenza artificiale. Quando una macchina produce risposte ordinate e persuasive, può diventare troppo facile scambiare il responso per giudizio. Sono d’accordo. Ma, naturalmente, è questione di cosa intendiamo per “giudizio”. Se, con la parola “giudizio”, intendiamo un atto di scelta libera che le persone fanno di fronte ad una alternativa esplicitamente contemplata, allora – sì – le macchine in genere non lo fanno. Normalmente un sistema automatico classifica un evento come una istanza di una certa categoria. Per esempio, può registrare che un’automobile va più veloce di quanto sia permesso in quella zona e magari applicare automaticamente una multa. Un sistema automatico può senz’altro riconoscere il superamento del limite. Può verificare l’orario, la zona, la velocità registrata, anche la storia precedente del guidatore. Può assegnare un punteggio di rischio, produrre una raccomandazione, generare perfino una motivazione: infrazione accertata; sanzione proporzionata; nessuna eccezione prevista. Tutto questo può essere utile e in molti casi anche più preciso e meno arbitrario di un essere umano distratto.

Da un certo punto di vista, le macchine hanno un atteggiamento più distaccato ed “olimpico” nel valutare le alternative. Nell’elaborazione delle informazioni sono dei campioni. Ma è dubbio che si tratti davvero di giudizio o di classificazione. Classificare significa collocare un caso dentro una categoria. Giudicare significa anche chiedersi se quella categoria, pur corretta, esaurisca ciò che è moralmente e socialmente rilevante nel caso. Colella è un automobilista che ha violato una norma. È vero. Ma è anche un padre di novantasei anni che accompagna il figlio malato in ospedale. I giudizi, a differenza delle classificazioni, richiedono che i loro portatori siano impegnati verso ciò che dicono. E qui sta la differenza che deve aver portato il giudice Caprio a fare quello che ha fatto. Non voleva essere impegnato verso il risultato della classificazione e ha trovato nell’interpretazione del diritto il modo di farlo. Una società giusta non applica le norme meccanicamente. Affida a qualcuno l’autorità e la responsabilità di portare la norma dentro il caso senza distruggere né l’una né l’altro. Questa è la parte difficile del giudizio: sostenere pubblicamente che, in quel caso, quella risposta è la risposta giusta.

I modelli linguistici di grandi dimensioni, Large Language Models o LLMs, sono la base della nuova intelligenza artificiale generativa. Sono bravissimi nella produzione di risposte e giustificazioni. Possono spiegare perché una certa azione è moralmente discutibile, perché una decisione amministrativa sembra proporzionata, perché un candidato appare adatto, perché una richiesta dovrebbe essere respinta. La forma esterna del giudizio è ormai alla loro portata. Sembra, però, mancare l’impegno verso ciò che dicono. L’adesione a una certa credenza non ha effetti sulla loro vita, come li ha sulla nostra. Dopotutto, non hanno un corpo, non rischiano la vita e non vogliono riprodursi. Però producono cose che sembrano giudizi, almeno dalla loro forma e quanto alla capacità di essere giustificate. Viene voglia di delegare il giudizio alle macchine, se sono così brave. In un recente preprint di Henrique Ferraz de Arruda e Yamir Moreno, The social consequences of AI delegation, gli autori mettono a fuoco proprio questo punto. Secondo loro, però, la delega all’intelligenza artificiale non riguarda soltanto l’efficienza delle decisioni, ma modifica il tessuto sociale in cui le decisioni vengono prese. Quando deleghiamo a una macchina una parte crescente della deliberazione, non stiamo soltanto risparmiando tempo. Stiamo spostando il luogo in cui si forma il giudizio. È vero, con la preoccupazione ulteriore che spiegare una scelta e giustificare una decisione non sono la stessa cosa. Un modello può anticipare ciò che una persona farà, produrre una spiegazione plausibile di quella scelta e generare una giustificazione. Ma giustificare una decisione richiede un passaggio ulteriore, ossia, assumere quelle ragioni come proprie, restare esposti alla loro contestazione, accettare che qualcuno chieda conto di ciò che è stato deciso.

Inoltre, i giudizi morali degli LLM sono più “fragili” di quanto la loro struttura linguistica faccia pensare. In un recente studio dedicato a questo aspetto (The Fragility of Moral Judgment in Large Language Models) viene suggerito che, in molti casi, basta cambiare il punto di vista narrativo, l’ordine delle informazioni, la forma della richiesta o i segnali persuasivi per modificare la valutazione morale del modello. Questo non significa che gli esseri umani siano sempre più stabili. Anche noi siamo influenzati dal modo in cui una storia viene raccontata. Il giudizio umano non è infallibile. È però inserito in pratiche che possono correggerlo: discussione, appello, motivazione, revisione, responsabilità personale. Il giudice può sbagliare, ma firma. La firma non garantisce la verità della decisione; garantisce che la decisione non sia senza padre. Nel caso dell’intelligenza artificiale, invece, il rischio è che la fragilità del responso sia coperta dalla forza della forma. La risposta è scritta bene, sembra bilanciata, enumera i fattori rilevanti, conclude con prudenza.

Il ricorso all’intelligenza artificiale nei processi decisionali è ormai un dato di fatto. In sanità, nella pubblica amministrazione, nell’impresa, nella ricerca, nell’educazione, gli strumenti di IA aiutano a evitare errori, allargare il campo delle informazioni, individuare regolarità che sfuggono allo sguardo umano. Forniscono anche “giudizi”, se si vuole. Ma sono piuttosto economici, perché dopo tutto deficitano dell’impegno pratico che normalmente i giudizi implicano. Gli umani potrebbero percorrere l’ultimo miglio del giudizio in modo personale e responsabile, e in molti casi sarebbe conveniente che lo facessero. Ma si tratta di rinunciare alla pigrizia, per così dire, offerta generosamente dall’intelligenza artificiale. Chissà se lo faranno. O, per meglio dire, chissà chi approfitterà della classificazione automatica per migliorare la propria capacità di giudizio personale e chi, invece, prenderà per buoni tutti i suggerimenti pratici della macchina, anche quelli che sono generati, come dire, “a cuor leggero”.

Bussola AI è una rubrica ideata e offerta in forma gratuita da Fondazione Innovation Island ETS alla Community di Innovationisland.it.