Conclusione: il Teorema di Bayes

Siamo veramente arrivati in fondo all’illustrazione del Teorema di Bayes; adesso sapete che cos’è, come funziona, a cosa serve e perché è così importante.

Come ha detto Eliezer, adesso sei un iniziato della Cospirazione Bayesiana.

Volevo solo aggiungere poche parole, riguardo a un fatto che mi ha incuriosito la prima volta che ho letto questo articolo. La forma “canonica” del Teorema di Bayes, quella che potete trovare sui libri o anche su Wikipedia, è la seguente:

{\displaystyle p(A \vert X)=\frac{p(X \vert A) \cdot p(A)}{p(X)}}

che è significativamente più semplice e compatta di quella che invece Eliezer ripete più volte nel suo articolo:

{\displaystyle p(A \vert X)=\frac{p(X \vert A) \cdot p(A)}{p(X \vert A) \cdot p(A)+p(X \vert \neg A) \cdot p(\neg A)}}

La cosa mi aveva stupito e sono dovuto arrivare fino all’ultima riga dell’articolo per capire il motivo di questa scelta: non è che la forma scelta da Eliezer sia più semplice (no di certo), più elegante o più facile da ricordare della forma canonica; fatto sta che è la forma che corrisponde meglio alla realtà fisica che vogliamo interpretare con l’uso del Teorema di Bayes.

Nella forma canonica, per calcolare la probabilità a posteriori p(A \vert X) dobbiamo conoscere la probabilità a priori p(A) , la prima probabilità condizionale p(X \vert A) e la probabilità totale dell’evento p(X) .

Il problema, so lo vogliamo chiamare così, di questa rappresentazione sta nel fatto che per usarla devo appunto conoscere p(X) mentre, nella forma che abbiamo visto finora, al suo posto usiamo p(\neg X \vert \neg A) .

Perché non ci piace p(X) , al punto di usare una formulazione del Teorema di Bayes apparentemente molto più complessa?

Se rileggete l’ultimo paragrafo della terza parte della “spiegazione intuitiva”, vedete che le quattro quantità in gioco (la probabilità a priori, le due probabilità condizionali e la probabilità a posteriori) hanno tutte un significato fisico ben preciso: nell’esempio della mammografia le probabilità a priori e a posteriori si riferiscono alla probabilità che la paziente abbia o meno un cancro al seno, mentre le probabilità condizionali sono proprietà oggettive dell’esame (mammografia).

Cosa rappresenta invece p(X) ? Sempre nell’esempio rappresenta la probabilità che una donna del campione risulti positiva alla mammografia.

Il motivo per cui questo valore non piace ad Eliezer, è che non è né carne né pesce: dipende sia dalle caratteristiche dell’esame (cioè dalle probabilità condizionali) che dall’incidenza di cancro al seno tra le partecipanti allo screening (probabilità a priori).

Intendiamoci, è un valore perfettamente lecito. Anzi, se dovessimo usare il Teorema di Bayes per interpretare i risultati di uno screening, è un dato che sarebbe comodamente disponibile: se su 1000 donne del campione trovo 132 mammografie positive, p(X)=0,132=13,2% .

È quando cerchiamo di usare il Teorema di Bayes per prevedere i risultati, o meglio per prevedere l’incidenza a posteriori tra le donne che risultano positive all’esame, che questo valore diviene scomodo. Se voglio prevedere quale sarà la probabilità di un evento, non posso basarmi sui risultati di una serie di test o esperimenti, non sarebbe più una previsione!

L’approccio puramente bayesiano richiede che io preveda la probabilità a posteriori basandomi su informazioni che sono già disponibili: la probabilità a priori e le due probabilità condizionali.

E quindi, tolleriamo questa maggiore complessità della formula del Teorema di Bayes in cambio di un maggiore aderenza alla realtà fisica:

{\displaystyle p(A \vert X)=\frac{p(X \vert A) \cdot p(A)}{p(X \vert A) \cdot p(A)+p(X \vert \neg A) \cdot p(\neg A)}}

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Chaos Legion wants you!