Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
I valori Shapley sono una tecnica di interpretazione dell’AI (Shap) che ci aiuta a capire quali variabili di input contribuiscono maggiormente alle previsioni finali del modello. Ma come funzionano esattamente questi valori e da dove vengono?
Innanzitutto, i valori Shapley si basano sulla teoria dei giochi cooperativi, una branca della matematica che studia il comportamento strategico di un gruppo di giocatori che cercano di raggiungere un obiettivo comune. Nel caso dei valori Shapley, i “giocatori” sono le variabili di input di un modello predittivo e l’obiettivo comune è la previsione finale del modello.
Per capire meglio come funzionano i valori Shapley, possiamo immaginare di essere in una partita di basket con gli occhi coperti. Ascoltiamo l’annunciatore che ci dice quali giocatori entrano e escono dal campo, ma non sappiamo chi ha segnato un punto. L’unica cosa che possiamo fare per valutare l’efficacia dei giocatori è pensare che l’ultimo giocatore arrivato abbia avuto a che fare con l’ultimo risultato buono o cattivo che sia. Se calcoliamo le valutazioni dei giocatori per l’intera partita, possiamo stabilire quali giocatori sono maggiormente correlati con i risultati migliori, quali sono maggiormente correlati ai risultati peggiori e quali non hanno alcun effetto.
Nella teoria dei giochi cooperativi, le combinazioni di giocatori sono chiamate “coalizioni”, le differenze nei punteggi sono i “contributi marginali” e i valori Shapley sono la media di questi contributi su molte simulazioni. Nel caso di un modello di machine learning, le variabili di input sono i “giocatori”, i diversi sottoinsiemi di variabili sono le “coalizioni” di giocatori e le differenze nell’errore predittivo sono i “contributi marginali”.
Per calcolare il valore Shapley per una variabile e un sottoinsieme specifico, si calcola il contributo quando si aggiunge quella variabile a quel sottoinsieme e si sommano i contributi su tutti i possibili sottoinsiemi. In parole povere, il valore Shapley è il contributo marginale medio di una variabile in tutti i possibili sottoinsiemi. Tuttavia, il calcolo del valore Shapley ha un costo computazionale molto elevato, quindi vengono utilizzate strategie come il metodo Monte Carlo sampling per campionare casualmente una distribuzione di probabilità. Solo alcuni explainer calcolano i valori Shapley in brute force, per maggiori informazioni leggi l’articolo Gli Explainer di SHAP per spiegare un modello ML.
Per quanto riguarda il calcolo di un modello, una variabile non può essere eliminata, quindi l’algoritmo dello SHAP mescola le variabili per calcolare la loro importanza.
La consistenza di queste permutazioni è assicurata dalle seguenti proprietà della teoria dei giochi:
Per vedere dei tutorial cerca nella sezione XAI del nostro sito.