Bayesiaanse inferentie

Misschien heb je er een trauma aan overgehouden: de vaasmodellen die bij statistiek op de middelbare school voorbijkwamen. “Je hebt een vaas met tien knikkers, waarvan drie rode en zeven blauwe. Vervolgens trek je twee knikkers zonder terugleggen. Wat is de kans dat je een rode en blauwe bal trekt?” Hiervoor kun je een boomdiagram tekenen en alle mogelijkheden meetellen. “Hoe vaak ga ik in mijn leven nog knikkers uit vazen trekken?” vraagt menig scholier zich af terwijl hij het antwoord “21/90” opschrijft. Want vaasmodellen zijn hopeloos versimpeld, en zelfs bij een potje regenwormen worden kansberekeningen al snel ingewikkelder dan welk vaasmodel dan ook. Vaasmodellen geven dus een versimpeld beeld van de werkelijkheid.

Venijnige trauma’s

Maar er zit nog iets venijnigs in deze sommen. Dat heeft alles te maken met een lange strijd die in de wiskundewereld woedt: de strijd tussen “Bayesianen en frequentisten”. Die strijd gaat over de vraag wat nou precies een kans is. Neem ons eerdere vaasmodel. Wat is de kans dat je één blauwe bal trekt? Wel, je telt het aantal blauwe ballen (zeven), en het totale aantal ballen (zeven plus drie is tien), en je deelt deze twee getallen op elkaar. De kans op een blauwe bal is dan 7/10=0,7=70%. De betekenis hiervan is dat als je het experiment heel vaak uitvoert bij identiek voorbereide vazen, je uiteindelijk in 70% van de gevallen een blauwe bal trekt. Bij een paar keer trekken kan het deel blauwe ballen nog flink afwijken van 70%, maar hoe vaker je het experiment herhaalt, des te dichter zal het deel aan blauwe ballen naar 70% gaan. We noemen dit een frequentistische kans, omdat deze gebaseerd is op een “frequentie”: het aantal keren dat je het experiment uitvoert.

De getraumatiseerde scholier kan, murwgeslagen door alle sommen met vazen en ballen, op een gegeven moment denken dat “de kans op een blauwe bal” een objectieve eigenschap is van de vaas, net zoals zijn kleur, vorm of gewicht die simpelweg is te bepalen door (herhaaldelijk) te experimenteren. Maar is dat wel zo? Wel, we kunnen een simpel tegenvoorbeeld hiervan bedenken: wat is de kans dat Geert Wilders bij de verkiezingen op 22 november 2023 minister-president wordt? De scholier die alleen met vaasmodellen rekent heeft de neiging om dit probleem te vertalen naar vazen met ballen. We moeten dan heel vaak minister-presidenten uit de tweede kamervaas trekken, en dan kijken in hoeveel van de gevallen we Geert Wilders hebben getrokken. Maar in de praktijk werkt dat natuurlijk niet zo. Wat is dan de betekenis van zo’n uitspraak? Oftewel: kunnen we kansen toedichten aan eenmalige gebeurtenissen? Een erg belangrijke vraag als je bijvoorbeeld rechter bent; daarin wil je immers beoordelen hoe waarschijnlijk het is dat een verdachte (on)schuldig is!   

Enter Bayes

Wat blijkt: we kunnen inderdaad een kans toedichten aan eenmalige gebeurtenissen. Alleen moet je dan je opvatting over kansen bijstellen. Deze manier van kansen opvatten noemen we “Bayesiaanse statistiek”, en in de praktijk verschillen de berekeningen vaak niet eens zoveel van de “frequentistische statistiek”. Het idee van de Bayesiaanse statistiek is dat een kans iets subjectiefs is. Het zegt iets over het vertrouwen dat iemand in een hypothese legt. Dat vertrouwen zou je kunnen staven met de vraag hoeveel geld iemand zou willen inleggen op een bepaalde hypothese. Als deze persoon vervolgens informatie verzamelt, dan moet ze telkens haar vertrouwen in de hypothese bijstellen. Een voorbeeld: ik heb geen enkele reden om te geloven dat ik geadopteerd ben. Maar als ik erachter kom dat mijn geboortefoto’s nep zijn, ik een geboorte-akte tegenkom waarop ik sta geregistreerd bij een Vlaams weeshuis en me plotseling niet meer hoef af te vragen waarom ik altijd zo’n trek in friet heb (en het woord “patat” verafschuw), dan wordt mijn vertrouwen in mijn ouderlijke afkomst al een stuk kleiner. Dat is het idee van Bayesiaanse statistiek of “inferentie”: met het vergaren van meer en meer achtergrondinformatie kun je steeds meer (of minder) vertrouwen leggen in een hypothese. Dit is dus een totaal ander kansbegrip dan onze vaas, waarbij de “kans” een eigenschap van de vaas zelf is in plaats van jouw persoonlijke, subjectieve vertrouwen!  

Een kwestie van wennen

Dat vinden veel mensen vaak wat onwennig. Want wat voor kans slinger je dan aan je hypothese vóórdat je in aanraking komt met de data? Als er veel achtergrondinformatie voor handen is, blijkt dat niet eens zoveel uit te maken. Uiteindelijk zul je vaak richting dezelfde waarschijnlijkheid gaan, ongeacht je “startwaarschijnlijkheid”. Maar vaak is er helemaal niet zoveel achtergrondinformatie. Wat is dan nog de waarde van Bayesiaanse inferentie?

Die waarde vind je in het ‘updaten’ van je waarschijnlijkheid. Dat doe je met de zogenaamde stelling van Bayes. Deze stelling zegt in woorden het volgende:

De kans dat een hypothese waar is, gegeven de data  =

(kans op data, gegeven de hypothese) x (kans op hypothese)/(kans op data)

Wat valt op:

  • Je rekent de kans op een hypothese gegeven de data uit met het omgekeerde: de kans dat je de data aantreft gegeven de hypothese. Oftewel: hoe waarschijnlijk is het dat je de data aantreft als je aanneemt dat je hypothese klopt?
  • Je deelt door de kans dat je de data aantreft. “Typische” data is data die aanvankelijk (“a priori”, dus zonder verdere aannames) onwaarschijnlijk is. Je deelt dan door een klein getal, waardoor je kans op de hypothese gegeven de data juist groter wordt.

Met de stelling van Bayes kun je op rationele wijze doorrekenen hoe je aanvankelijke vertrouwen in een hypothese verandert wanneer je data aantreft.

Ziek zijn

Een bekend voorbeeld is het testen op een ziekte. Als je test op een ziekte, en je weet dat de test erg betrouwbaar is, dan zal een positieve test je waarschijnlijk flink doen schrikken. Veel mensen stellen de kans dat ze de ziekte hebben dan gelijk aan de betrouwbaarheid van de test. Maar dat kun je helemaal niet zeggen. De kans dat je ziek bent zal namelijk afhangen van hoeveel de ziekte voorkomt! Om een getallenvoorbeeld te nemen: stel dat de test 99,99% betrouwbaar is. Dat betekent dat in 99,99% van de gevallen de test de juiste uitslag geeft (en in 0,01% niet). Wat is nu de kans dat je ziek bent bij een positieve testuitslag? Surprise: dat kun je helemaal niet uitrekenen. Om dat te illustreren nemen we een extreem geval: stel dat de ziekte bij slechts 1 op de 100.000 mensen voorkomt. De kans dat je ziek bent is dus vóór de testuitslag 1 op de 100.000. Neem nu eens een groep van 100.000 mensen. Je verwacht dat hiervan slechts 1 persoon daadwerkelijk ziek is. Maar de test is 99,99% betrouwbaar en zal dus in 0,01% van de gevallen een verkeerde uitslag geven. Dat betekent dat bij onze groep van 100.000 mensen er 0,0001×100.000 = 10 mensen onterecht positief getest worden! Er zijn dus in de groep van 100.000 mensen 10 onterechte positieven en 1 terechte positieve: 11 positief getesten in totaal. De kans dat jij daadwerkelijk ziek bent en positief getest bent is dus 1/(1+10) = 9%. Je ziet dus dat de zeldzaamheid van de kans tegen de betrouwbaarheid van de test opbokst. Als de ziekte zeldzamer wordt, zal de groep mensen waarbij minstens één zieke aanwezig is groter worden, en dan zal de onbetrouwbaarheid van de test je meerdere valse positieven opleveren. Daardoor zal de uiteindelijke kans op je ziek-zijn nog steeds betrekkelijk klein zijn. In de praktijk zal die kans natuurlijk hoger zijn, want je wordt vaak niet voor niks getest. Je hebt bepaalde symptomen, je hebt genetische aanleg, noem maar op. Die data vergroot de kans dat je daadwerkelijk ziek bent. Maar dit getallenvoorbeeld laat mooi zien hoe onze intuïtie verkeerd kan zijn. Als je nog een ander voorbeeld hiervan wilt zien: google op het Monty-Hall probleem, waarbij je een auto kunt winnen of een geit kunt aantreffen, of het zogenaamde “taxi-probleem”.

“Please put down your weapon”

Bayesiaanse inferentie heeft veel toepassingen. Het voorbeeld hierboven zou je met een kritische bril nog niet echt “Bayesiaans” kunnen noemen, want je gebruikt immers nog steeds frequentistische argumenten (“de kans dat jij daadwerkelijk ziek bent en positief getest bent is dus 1/(1+10) = 9%”) en herhaalde experimenten. Maar er zijn ook legio gevallen waarbij frequentistische statistiek tekortschiet. Als je bijvoorbeeld ooit eens je sokken of je nucleaire duikboot kwijtraakt, dan kun je met Bayesiaanse zoekmethoden ze weer terugvinden (zie b.v. https://en.wikipedia.org/wiki/Bayesian_search_theory en https://www.youtube.com/watch?v=82q3uYw6MuY). Als je een kunstmatige intelligentie (KI) wilt trainen, dan zul je Bayesiaanse methoden moeten gebruiken: een KI moet immers keuzes maken en hypothesen beoordelen zoals gevaar inschatten. Wie wil zien hoe fout dat kan gaan kan de klassieke scene uit de film Robocop met ED209 raadplegen:

Bayesiaanse inferentie heeft niet alleen een rol in kunstmatige intelligentie en moordlustige robots. De historicus Richard Carrier past in zijn boek “On the historicity of Jesus” Bayesiaanse inferentie toe op historische vraagstukken zoals de vraag of Jezus echt bestaan heeft. Dat levert subjectieve analyses op, maar je kunt daarin wel rationeel doorrekenen hoe je vertrouwen in bepaalde data je vertrouwen in een hypothese versterkt of verzwakt. Dat je hierbij makkelijk in valkuilen kunt stappen laten de zaak van Lucia de Berk en Sally Clark zien, die beiden onterecht werden veroordeeld voor moord basis van een Bayesiaanse berekening. Daniel Kahnemans “Thinking, fast and slow” besteedt ook aandacht aan Bayesiaanse inferentie. Wil je meer weten over de zogenaamde “replicatie crisis” in de sociale wetenschappen (het fenomeen dat veel wetenschappelijke resultaten niet reproduceerbaar zijn) met betrekking tot Bayesiaanse statistiek, dan kun je het fascinerende boek “Bernoulli’s fallacy” van Aubrey Clayton lezen. Ook het boek “Kan dat geen toeval zijn?” van Ronald Meester en Klaas Slooten over diezelfde replicatie crisis is een aanrader.

Tot slot kun je je als natuurkundige afvragen of er daadwerkelijk “eenmalige gebeurtenissen” zijn als je de zogenaamde “Many Worlds Interpretation” van de kwantummechanica gelooft. Want daarin splitst het universum zich elke seconde ziljoenen keren af waarbij alle mogelijkheden daadwerkelijk gerealiseerd worden. Heel misschien wordt onze verwarring tussen Bayesiaanse en frequentistische kansen wel veroorzaakt omdat we niet verder kijken dan “ons” universum. Als je meer wilt weten over deze “Many Worlds Interpretation” kun je mijn boek “Ruimte, tijd, materie” erop naslaan of Sean Carroll (een fervent voorstander van deze interpretatie) op YouTube opzoeken.

Bayesiaanse inferentie levert dus een rationele manier op om hypothesen te beoordelen. Maar met Lucia de Berk, Sally Clark en ED209 in het achterhoofd weet je dat je daarbij altijd voorzichtig moet blijven. “You have twenty seconds to comply…”


Geplaatst

in

door

Reacties

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *