Ik blader wat in de jongste Nieuwsbrief van de Vereniging voor gedragstherapie en cognitieve therapie (VGCt, 2009). De lezer wordt verzocht to be good and tell about it. Nou, dat zal ik doen. Ton van Balkom, voorzitter van de werkgroep die de ‘Multidisciplinaire richtlijn angstsstoornissen en depressie’ heeft herzien, licht de veranderingen toe sinds de richtlijnen van 2003 en 2005. ‘Het belangrijkste verschil is dat de richtlijn stepped care is gemaakt.’ (p. 1) CGt ‘is een belangrijke evidence-based psychotherapie. Dat is het nog steeds. Er is ondertussen ook wetenschappelijke evidentie ontstaan voor andere psychotherapievormen. Bij iemand die voor de eerste keer een ernstige depressie heeft, kan worden gekozen voor cognitieve gedragstherapie, interpersoonlijke therapie of een kortdurende psychodynamische therapie.’ (p. 2)
Het is mooi dat de VGCt daar kond van doet. Maar in de rest van de nieuwsbrief overheersen de propagandistische toon en de reclamepraatjes. Bij de VGCt heb je vaak het idee dat ze stofzuigers verkopen en niet dat ze er zijn voor patiënten en hun problemen.
Wat daarbij verder opvalt, is het totale gebrek aan twijfel over de werkzaamheid van CGt – voor alle kwalen, ook voor ‘hele ingewikkelde dingen die met iemands persoonlijkheid te maken hebben.’ (p. 4) Het bontst maakt ’t de voorzitter van de VGCt, Kees Hoogduin, altijd al een extremist in het Nederlandse psychotherapielandschap: ‘[H]et is natuurlijk verbazingwekkend dat, hoewel allerlei richtlijnen aangeven dat CGt de psychologische interventie van keuze is, de kans nog klein is dat je als patiënt CGt aangeboden krijgt. Mensen krijgen echter wel allerlei behandelingen waarvan is aangetoond dat ze geen enkel nut hebben. Wij willen zorgen dat mensen op de eerste plaats de behandeling krijgen waarvan is bewezen dat die effectief is.’ (p. 4) Nu bestaan er ongetwijfeld behandelingen waarvan de werking nog niet is aangetoond, maar dat is toch echt iets anders dan ‘waarvan is aangetoond dat ze geen enkel nut hebben.’ Wat meer nuance en bescheidenheid zou u sieren, mijnheer Hoogduin.
Ik heb altijd gedacht dat wetenschap en onderzoek gepaard gingen met twijfel en onzekerheid. Popper meende dat kennis nooit zeker, maar altijd voorlopig is. Van die onzekerheid is tegenwoordig weinig meer te merken: iets is onderzocht (‘Uit onderzoek blijkt …..’) en daarmee basta. De logica eist, volgens dezelfde Popper, dat onderzoekers moeten proberen hun eigen theorieën naar de prullenmand te verwijzen. Helaas ontbeerde de scherpzinnige filosoof iedere elementaire mensenkennis: onderzoekers hangen aan hun theorieën en hun eigen voorkeuren, laten die niet zomaar los, ook als de data in een andere richting wijzen. In welk mate onderzoekers frauderen, weten we niet, maar sommige gegevens zijn verdacht. Luborsky en zijn medewerkers kwamen in 1999 tot de nogal ontluisterende bevinding ‘dat bijna twee derde van de variantie in de resultaten [van therapievergelijkingen] was toe te schrijven aan de theoretische loyaliteit.’ (Luborsky & Barrett, 2005, p. 264) Anders gezegd: een onderzoeker die een fan is van CGt komt vrijwel nooit tot de conclusie dat een psychodynamische psychotherapie net zo goed of beter werkt, en vice versa. In 2005 analyseerden ze opnieuw al het recente vergelijkende psychotherapieonderzoek en vergelijkingen van psychotherapie met farmacotherapie en hun bevindingen bleken nog niets aan actualiteit te hebben ingeboet (Luborsky & Barrett, 2005, p. 266). Er is alle reden om (alle!) onderzoeksresultaten met gepast wantrouwen te blijven bezien.
Het is dan ook geen vooruitgang dat steeds meer onderzoek door het bedrijfsleven wordt gefinancierd en door particuliere onderzoeksinstituten wordt uitgevoerd. De universiteit is allang niet meer de primaire en onafhankelijke onderzoeksinstelling die zij vroeger was.
Om het bij de gezondheidszorg te houden: het beruchtste voorbeeld van door financiële belangen gestuurd onderzoek is, zoals alom bekend, dat van de farmaceutische industrie. De Britse psycholoog Irving Kirsch schrijft in zijn recente boek (Kirsch, 2009) dat hij in vijftien jaar onderzoek eigenlijk telkens van de ene verbazing in de andere viel.
Verschillende antidepressiva (nieuwe en oude) en andere chemische middelen, bijvoorbeeld (in)slaapmiddelen of benzodiazepinen, zoals Seresta of Valium, en zelfs depressants oftewel depressief makende middelen, bleken een ongeveer gelijk therapeutisch effect op depressie te hebben. Behalve dat de middelen dus niet erg specifiek werken, is het therapeutische effect nogal gering, want het placebo-effect is groot. Kirsch stelde zich in de jaren ’90 dan ook ten doel niet alleen de vraag te beantwoorden waarom het (drug)effect (= algeheel effect minus placebo-effect) zo minimaal is, maar ook waarom zowat alle middelen een vergelijkbaar (klein) therapeutisch effect hebben op depressie. Zijn hypothese luidde uiteindelijk: het (totale) effect is het resultaat van de bijwerkingen! Die zijn voor de gebruikers zo makkelijk vast te stellen dat proefpersonen in onderzoek met een grote kans op succes (p ≈ 0,8) kunnen raden of zij een echte dan wel neppil krijgen toegediend – met alle gevolgen van dien voor hun verwachtingen over het therapeutische effect. Die hypothese werd langzaam maar zeker steeds plausibeler: hoe meer de bijwerkingen van antidepressiva en neppillen in onderzoek op elkaar leken, des te kleiner was het drugeffect. Zo voortbordurend komt Kirsch uiteindelijk tot de conclusie dat het drugeffect vrijwel zeker een ‘uitgebreid’ (enhanced) placebo-effect is. Of in gewoner Nederlands: antidepressiva werken gewoon niet – ondanks al het ‘moois’ dat de farmaceutische industrie ons decennialang heeft voorgespiegeld.
Op een heel ander gebied, dat van de cognitieve neurowetenschap oftewel hersenonderzoek, is er recentelijk ook hard aan alle vermeende zekerheden geknaagd. Vul, Harris, Winkielman en Pashler (2009a) onderzochten de torenhoge correlaties (vaak hoger dan 0,80) die neurowetenschappers rapporteren tussen individuele verschillen in persoonlijkheid, emotie en sociale cognitie en fMRI-scans. Vul cum suis laat allereerst zien dat deze correlaties onwaarschijnlijk zijn: de maximale correlatie tussen twee variabelen wordt naar boven begrensd door het product van de betrouwbaarheid van de afzonderlijke meetmethoden. De betrouwbaarheid van persoonlijkheidsvragenlijsten en fMRI-metingen maken volgens de auteurs in het gunstigste geval een correlatie mogelijk van ten hoogste 0,74. Daarbij gaan ze ervan uit dat de vragenlijst een betrouwbaarheid van 0,8 zou hebben en fMRI-metingen een van 0,7, en hanteren zij de – om meerdere redenen onrealistische – aanname dat de ‘ware’ correlatie (zonder meetfout) tussen beide variabelen perfect zou zijn. In de praktijk ligt het plafond dus nog een stuk lager dan 0,74, maar desondanks worden in neurowetenschappelijk onderzoek legio correlaties gerapporteerd van die orde of hoger (Vul en anderen, 2009, p. 276).
Vervolgens laten deze onderzoekers in hun artikel zien dat die hoge correlaties tot stand komen door een self-fulfilling prophecy of cirkelredenering: ze zijn gebaseerd op de gemiddelde activatie van een beperkt aantal voxels (driedimensionale pixels) die zijn gekozen (aan selectie valt bij bij fMRI-onderzoek niet te ontkomen) omdat ze het hoogst correleren met de onderzochte gedragsscore. Dan dankt zo’n hoge correlatie je de koekoek. Denk bijvoorbeeld aan een college dat adverteert met de kwaliteit van zijn onderwijs door te wijzen op de superieure prestaties van zijn studenten – maar alleen eerstejaars met de hoogste eindexamencijfers toelaat. Zoiets. Vul en de zijnen noemen deze denkfout (of oplichting) de nonindependence error (p. 279).
Op de conclusies van Vul cum suis (2009a), al langere tijd te vinden op internet onder de titel ‘Voodoo correlations in social neuroscience’, zijn nogal wat reacties gekomen. Er worden ook andere verklaringen aangedragen voor de te hoge correlaties (bijvoorbeeld: te kleine steekproeven en dus te weinig onderscheidingsvermogen: zie Yarkoni, 2009), maar niemand ontkent dat de correlaties zijn opgepompt. Vul, Harris, Winkielman en Pashler (2009b) kunnen dan ook enigszins triomfantelijk concluderen: ‘Er lijkt consensus te bestaan over onze centrale stelling, die zegt dat de vele niet-onafhankelijke correlaties die worden gerapporteerd in de literatuur kunstmatig opgeschroefd (inflated) zijn.’ (p. 319)
Ook de resultaten van hersenonderzoek, met al die ultramoderne scanapparatuur en mooi gekleurde hersenplaatjes, zijn dus lang niet zo onbetwistbaar als leken en lichtgelovige professionals altijd geneigd zijn te denken. Leve de twijfel.