Voordat ik mijn bezwaren tegen het depressieprotocol uiteenzet, is een korte samenvatting van het depressieprotocol nodig. Ik volg daarbij de terminologie van het protocol.
Kern van het depressieprotocol is dat de diagnostiek en behandeling van depressie volgens een vast en geformaliseerd traject verloopt waarin gestandaardiseerde beslismomenten, evaluatiemomenten en evaluatiecriteria zijn opgenomen (p. 5). De behandeling is symptoom- en klachtgericht en wordt genoemd: Programmagecentreerde Kortdurende Psychotherapie voor depressie, kortweg PKP voor depressie (p. 22). De behandeling heeft maximaal twintig zittingen in een periode van drie tot zes maanden, inclusief een therapiegerichte diagnostiekfase. De behandeling is afgeleid van cognitieve gedragstherapie en interpersoonlijke therapie. Deze vormen van psychotherapie worden beschouwd als de meest aangewezen weg voor elke behandeling van depressie (p. 14). Als dit nodig is, moeten psychotherapeuten dan ook in een nog op te zetten netwerk van gerichte cursussen worden bijgeschoold in de protocollen die binnen deze kortdurende behandelvormen gemaakt zijn (p. 22).
Fase 1 van het depressieprotocol is een diagnostische, en resulteert in een depressiediagnose volgens de DSM-IV, de zogenaamde depressiebeoordeling. Op grond hiervan worden bepaalde patiëntengroepen van PKP uitgesloten. PKP is gecontra-indiceerd bij bipolaire stoornissen; depressie bij schizofrenie of acute psychotische beelden; bij een al te ernstige (somatische) comorbiditeit en/of een voortdurende zorgbehoefte. PKP is niet nodig in het geval van een depressieve periode door ongecompliceerde rouw; en PKP wordt als ongewenst beschouwd als de patiënt de behandeling niet wil, of er door ernstige cognitieve of contactuele defecten niet toe in staat is. Tenslotte kunnen in de behandeling van depressie bij kinderen en jeugdigen andere interventiemethoden zijn vereist dan in het protocol worden voorgeschreven.
In alle andere gevallen van depressie echter, en dus ook bij depressie bij ouderen en depressie in combinatie met een persoonlijkheidsstoornis, depressieve stoornis (major depressive disorder), milde depressie, dysthyme stoornis en een aanpassingsstoornis met depressie, is PKP de aangewezen behandelvorm, eventueel in combinatie met medicatie. In het geval dat belangrijke anderen als partner, gezinsleden of ouders een belangrijke rol lijken te spelen in de depressieve klachten, worden zij in het traject betrokken.
De tweede diagnostische fase van de therapiegerichte diagnostiek volgt nadat op basis van de depressiebeoordeling tot PKP is besloten. Op grond van een beoordeling van onder meer etiologische factoren, de kwaliteit van het steunsysteem en persoonlijkheidskenmerken wordt bepaald welke elementen van de cognitieve en interpersoonlijke therapie in de PKP het accent krijgen (p. 14 en 22). Deze fase resulteert in een behandelplan en gaat geleidelijk over in daadwerkelijke behandelinterventies. Tijdens de PKP worden de resultaten en vorderingen geëvalueerd en vindt in ieder geval na zes maanden een herbeoordeling plaats. Bij onvoldoende effect kan tot een nieuwe PKP worden besloten, eventueel in combinatie met (veranderde) medicatie of ondersteunende interventies, al dan niet bij een andere therapeut. Tot een voortgezette (langdurige) therapie kan worden besloten als de argumenten daarvoor «expliciet en dus toetsbaar» zijn en als uitvoerig is geïnventariseerd waarom de eerdere behandeling geen duurzaam effect heeft gehad (p. 14 en 18).
Mijn kanttekeningen bij het depressieprotocol gaan niet over voors en tegens van kortdurende cognitieve gedragstherapie en interpersoonlijke psychotherapie, of de daarop gebaseerde PKP. Waar het mij wel om gaat is de exclusieve rol die PKP als primaire behandelvorm van depressie krijgt toebedeeld, en de wetenschappelijke argumentatie waarop deze uitverkiezing is gebaseerd. Ik vat hier kort samen; daarna werk ik deze klinische en wetenschappelijke kanttekeningen verder uit.
Het eerste bezwaar geldt de uniformering van de psychotherapeutische behandeling van depressie. PKP moet standaard worden toegepast bij alle vormen van niet-psychotische, unipolaire depressie: «De psychotherapeut kan het vermoeden hebben dat er qua aantal zittingen en behandelduur niet kan worden volstaan met PKP. Ondanks deze relatieve contra-indicatie is het advies om toch met PKPte beginnen.» (p. 18). Deze uniforme behandelwijze kan echter een nodeloze en demotiverende, en in dat geval ook anti-therapeutische omweg zijn als bij aanmelding al redelijkerwijs te veronderstellen is dat een andere, bijvoorbeeld langerdurende behandelvorm voor de patiënt en zijn depressie nodig en mogelijk is en door de patiënt wordt gewenst. Dit wordt straks met klinische voorbeelden geïllustreerd.
Het tweede bezwaar betreft de argumentatie waarop de uitverkiezing van PKP is gebaseerd. De keuze van de in het protocol voorgeschreven PKP is ingegeven door de resultaten van effectonderzoek naar kortdurende cognitieve gedragstherapie en interpersoonlijke therapie. Geconcludeerd wordt dat beide vormen van behandeling het effect van placebo's overstijgen, dat de uitval in onderzoeksgroepen gering is en dat beide therapievormen in een directe vergelijking even effectief zijn (p. 21). Over langdurige behandelingen van depressie daarentegen wordt opgemerkt dat voldoende en deugdelijk/vergelijkbaar effectonderzoek ontbreekt (p. 22).
Voor dit laatste probeer ik aannemelijk te maken dat effectonderzoek naar langdurige therapie op specifieke methodologische problemen stuit. Deze bestaan overigens ook in onderzoek naar de lange-termijneffecten van kortdurende therapie. De methodologische moeilijkheden en beperkingen komen voort uit het gegeven dat zulk onderzoek noodzakelijkerwijs een lange termijn beslaat. Deze dragen er toe bij dat het effectonderzoek naar langdurige therapie als ondeugdelijk terzijde wordt geschoven.
Een belangengemeenschap van therapeuten die uitsluitend kortdurende therapie voorstaan, financiers die uiteraard goedkope behandelingen willen en kwantitatief-empirische wetenschap die hun onderzoek beperken tot wat goed te onderzoeken is, kan dan vervolgens de tendentie versterken om met het ondeugdelijke effectonderzoek naar langdurige therapie, ook de langdurige therapievormen opzij te schuiven. In het onderstaande werk ik mijn kanttekeningen nader uit.
In de (ambulante) geestelijke gezondheidszorg worden patiënten met gelijksoortige psychische stoornissen vaak verschillend behandeld, terwijl patiënten met verschillende stoornissen vaak dezelfde behandelvorm krijgen. Aan die, zeker voor buitenstaanders als financiers, weinig overzichtelijke en dus ook weinig professioneel aandoende situatie, kan de invoering van klachtenspecifieke behandelprotocollen een einde maken. Er kunnen echter goede redenen zijn waarom voor de ene depressieve patiënt een kortdurende therapievorm is aangewezen, terwijl voor een andere patiënt, met soortgelijke depressieve klachten, een andere, langdurige therapievorm de voorkeur heeft.
Anna Freud schreef in 1954 al dat gelijksoortige of zelfs identieke symptomatologie gebaseerd kan zijn op heel uiteenlopende psychopathologie, en dat deze laatste bepaalt met welke behandeltechniek een patiënt moet worden benaderd. In overeenstemming hiermee laat Gabbard (1994) zien dat een DSM-IV-classificatie, en dus de depressiebeoordeling op basis van as i, onvoldoende basis is voor een differentiële indicatiestelling. Te veel van het functioneren van de patiënt en zijn omgeving blijft immers buiten beschouwing.
Het klinisch evidentiegevoel lijkt deze zienswijze voor menig therapeut te bevestigen. In het spreekuur of de intake kan naar voren komen dat de ene patiënt depressieve symptomen nodig heeft om zich voor desintegratie te behoeden, terwijl bij een andere patiënt gelijksoortige depressieve klachten juist op groeiende psychische gezondheid wijzen. Dit laatste kan het geval zijn als een voorheen gedepersonaliseerde patiënt zich aanmeldt na het verschijnen van een depressief gevoel. In het eerste geval lijkt een structurerende behandeling nodig; in het tweede is misschien een inzichtgevende behandeling nodig en mogelijk. Een langdurige therapie lijkt niet nodig bij een tot voor kort goed functionerende patiënt die naar aanleiding van een levensgebeurtenis depressieve klachten heeft gekregen, terwijl bij een patiënt met gelijksoortige depressieve klachten en met zware psychotraumata in de etiologie, alleen al het tot stand brengen van een voldoende veilige werkrelatie het tijdstraject van een kortdurende behandeling ruimschoots overschrijdt. Bij een depressieve patiënt met uitgesproken passief-agressieve strevingen in de persoonlijkheid, is de kans groot dat een kort, en in die zin directief behandelaanbod strandt in machteloosheidsgevoelens bij zowel de patiënt als therapeut.
Meer dan in de somatische geneeskunde gebruikelijk is, zijn voor patiënten met gelijksoortige klachten dus vaak verschillende therapievormen aangewezen. De indicatiestelling hangt niet alleen af van de aard van de klachten en symptomen, maar ook van de persoon van de patiënt, dat wil zeggen van de etiologie, betekenis en functie van de klachten, zijn mogelijkheden en wensen, en de relaties met de mensen om hem heen. Het diagnostisch onderzoek daarnaar moet juist gebeuren voordat tot een specifieke behandelvorm wordt besloten. In het depressieprotocol is dat tot op grote hoogte niet het geval, want de therapievorm PKP wordt geïndiceerd op basis van de classificatie van de depressieve klachten. Een diepgaander diagnostisch onderzoek van therapiegerichte diagnostiek vindt wel plaats, maar pas nadat de indicatie PKP is gesteld. Deze is bedoeld voor de specifieke invulling van de pkp: hetzij een cognitief, hetzij met een interpersoonlijk accent.
Hier volgt een korte samenvatting van de argumentatie in het depressieprotocol waarop de uitverkiezing van PKP is gebaseerd. Kortdurende cognitieve gedragstherapie en interpersoonlijke therapie zijn aangewezen als de primaire psychotherapeutische behandelvormen van ambulant te behandelen, niet-psychotische, unipolaire depressie. Deze keuze is gebaseerd op de resultaten van effectonderzoek. In gecontroleerd vergelijkend effectonderzoek zijn kortdurende cognitieve gedragstherapie en interpersoonlijke therapie voor de behandeling van depressie in ongeveer gelijke mate effectief gebleken, terwijl voor langdurende behandelingen deugdelijk/vergelijkbaar onderzoek ontbreekt (p. 14 en 21-22). Deze voorstelling van zaken is niet onjuist, maar wel te simpel.
Ten eerste plaats ik een opmerking bij de aangetoonde effectiviteit van beide kortdurende behandelvormen. In vergelijkend effectonderzoek zijn statistisch significante verschillen gevonden tussen de onderzoekscondities. Echter, de klinische relevantie van de statistisch significante verschillen (Kazdin, 1986) en de bestendigheid van de behandeleffecten op lange termijn zijn onzeker.
Een tweede opmerking gaat over de langdurige behandelingen. Het depressieprotocol stelt dat deugdelijk/vergelijkbaar effectonderzoek ont-breekt. Vergelijkbaar wil hier zeggen: vergelijkbaar met het onderzoek naar kortdurende therapie. De conclusie van het ontbreken van genoemd onderzoek is bijvoorbeeld overeenkomstig het overzicht van Bachrach, Galatzer-Levy, Skolnikkoff en Waldron (1991) van zes kwantitatieve studies over het effect van psychoanalyse bij ruim 500 patiënten. Er is weliswaar sprake van een verbeteringspercentage van 60 tot 90%, maar de methodologie van het onderzoek is «poor to very poor». Fisher en Greenberg (1996, p. 201) concluderen dan ook: «In feite kan elk onderzoek naar psychoanalyse als behandelvorm van tafel worden geveegd, omdat de onderzoeksgegevens ernstig gecontamineerd of gecompromitteerd zijn. Alle onderzoeken vertonen één of meer van de volgende tekortkomingen: de beperking tot behandelingen van slechts één therapeut; niet aangetoond is of een psychoanalyse feitelijk heeft plaatsgevonden; controlegroepen of alternatieve behandelgroepen ontbreken; de behandelaars zijn onervaren; in de schaarse vergelijkende studies zijn de patiënten niet gerandomiseerd aan de behandelvormen toegewezen; de beoordeling van het therapieresultaat door de therapeut is onbetrouwbaar of een beoordeling van de aantekeningen van de therapeut geldt als enige maat voor de werkzaamheid van de therapie.» (vertaling Gomperts).
De vraag is op zijn plaats naar de reden van deze methodologische tekortkomingen. Een eerste antwoord ligt in methodologische desinteresse of onkunde in het onderzoek naar langdurige therapie en/of in een behandelcultuur waarin analytici onvoldoende (willen) participeren in moderne onderzoeksactiviteiten. Een dergelijk antwoord is misschien (een beetje) juist, maar niet voldoende. Het lijkt het meest juist als het gaat om de volgende factoren uit het lijstje van Fisher en Greenberg: de beperking tot behandelingen van slechts één therapeut; de onervarenheid van behandelaars; de beoordeling van het therapieresultaat door de therapeut is onbetrouwbaar of een beoordeling van de aantekeningen van de therapeut geldt als enige maat voor de werkzaamheid van de therapie. In deze factoren moet verbetering mogelijk zijn.
In zoverre analytici bereid zijn in onderzoek te participeren, en onderzoeksanalytici niet minder van onderzoek snappen dan andere onderzoekers, wordt een tweede, interessanter antwoord meer relevant. Een centraal kenmerk van het specifieke onderzoeksobject, te weten de lange duur van de behandeling, draagt namelijk bij aan de methodologische problemen van het effectonderzoek. In het lijstje van Fisher en Greenberg staan in dat geval de volgende factoren voorop: het ontbreken van controlegroepen of alternatieve behandelgroepen; niet gerandomiseerd toewijzen van patiënten aan de behandelvormen; en niet aangetoond zijn of een psychoanalyse feitelijk heeft plaatsgevonden.
Mijn stelling is dat hoe langer de onderzoekstermijn, en die is in follow-up-onderzoek van langdurige therapie uiteraard lang, hoe moeilijker het wordt om een gerandomiseerd vergelijkend en gecontroleerd onderzoeksdesign op te zetten en vol te houden. Dit probeer ik in het onderstaande aannemelijk te maken.
In het wetenschappelijk onderzoek naar de effecten van psychotherapie ligt momenteel sterk de nadruk op de methode van de klinische trial met gerandomiseerde toewijzing. Gerandomiseerde toewijzing aan vergelijkingsgroepen en toezicht of de therapeuten zich houden aan de gestandaardiseerde behandelcondities, moeten een gecontroleerde vergelijking van therapie-effecten mogelijk maken, en daarmee een valide uitspraak over de relatieve werkzaamheid van therapievormen. Tegenover dit type effectonderzoek naar de werkzaamheid van een behandelmethode, de zogenaamde efficacy-studie, staat het onderzoek naar de doeltreffendheid van een behandeling in de dagelijkse praktijk, de effectiviteitsstudie. In dit tweede type effectonderzoek wordt in een naturalistisch design, dat wil zeggen zonder gerandomiseerde toewijzing van patiënten aan gestandaardiseerde behandelcondities, het effect van een behandeling bestudeerd. Een statistische vergelijking van conditiespecifieke behandeleffecten is dan niet mogelijk.
Vanwege de methodologische zuiverheid geldt de efficacy-methode tegenwoordig als noodzakelijke voorwaarde voor wetenschappelijk effectonderzoek. Er is een groeiende tendentie hier consequenties aan te verbinden voor de psychotherapeutische praktijk. Het depressieprotocol is hier een voorbeeld van. Cuijpers (1997) stelt: «De klinische trial is op dit moment terecht de maatstaf waar we de effectiviteit van interventies mee bepalen en het is niet te verdedigen om therapieën toe te passen die niet onderzocht zijn, terwijl effectief gebleken interventies voorhanden zijn.» (p. 341).
De essentie van het efficacy-onderzoek is de gerandomiseerde toewijzing van patiënten aan twee of meer gestandaardiseerde, en dus controleerbare, behandelcondities. Toonaangevend voorbeeld van de toepassing van de efficacy-methode (en bovendien gericht op depressie) is het omvangrijke National Health Institute of Mental Health Treatment of Depression Collaborative Research Program, het NIMH-depressieproject (Elkin, Parloff, Hadley & Autry, 1985). Tweehonderdvijftig patiënten, geselecteerd op de diagnose niet-psychotische unipolaire depressie, werden in drie universitaire onderzoekssettings gerandomiseerd toegewezen aan vier kortdurende behandelcondities: cognitieve gedragstherapie; interpersoonlijke psychotherapie; antidepressiva met steunend contact; placebo met steunend contact. Om zich ervan te vergewissen dat de behandelingen binnen één conditie op dezelfde manier werden uitgevoerd, moest de uitvoering volgens een vast protocol gebeuren, werden de behandelaars van tevoren intensief getraind in het toe te passen protocol, werd met video-opnamen gecontroleerd of zij zich aan het protocol hielden en werden zij zo nodig tussentijds gecorrigeerd. Na afloop van de behandeling van 16 tot 20 zittingen in 16 weken werd op basis van voor- en nametingen het effect van de behandelcondities vergeleken. De twee psy-chotherapeutische behandelvormen bleken allebei ongeveer even effectief, en niet minder effectief dan antidepressiva in combinatie met steunend contact (Elkin, Shea, Watkins, Imber, Sosky, Collins, Glass, Pilkonis, Leber, Dochery, Fiester & Parloff, 1989). In ander onderzoek zijn dergelijke resultaten ook gevonden (zie Dorrepaal, Van Nieuwenhuizen, Schene & De Haan, 1998).
Kortdurende therapie komt dus succesvol uit het onderzoek met de efficacy-methode. Hierna gaat mijn aandacht uit naar langdurige behandelingen. Zoals het depressieprotocol meldt, zijn deze niet deugdelijk/vergelijkbaar onderzocht.
Vaak wordt voor langdurige therapie (psychoanalyse of anderszins) gesteld dat gerandomiseerde toewijzing aan vergelijkingsgroepen op ethische en praktische moeilijkheden stuit; zie bijvoorbeeld Seligman (1995) en Sandell, Blomberg, Lazar, Schubert, Broberg en Carlson (1996). Het is ethisch onaanvaardbaar patiënten meerdere jaren in een placebo- of wachtlijstconditie te plaatsen, en in het geval van een vergelijking van concurrerende behandelcondities is een gerandomiseerde toewijzing van patiënten in strijd met een zeker voor langdurige therapie noodzakelijk geachte indicatiestelling. Bij een gerandomiseerde toewijzing aan een lange (en kostbare) be-handeling wordt de aanvaardbaarheid wel erg klein om aan de behandelmogelijkheden en -voorkeur van de patiënt voorbij te gaan.
Ook bij kortdurende therapie blijkt overigens dat randomisatie voor veel patiënten onaanvaardbaar is. De Jonghe en Wijn (1996) rapporteren dat 32% van de in lopend onderzoek betrokken depressieve patiënten gerandomiseerd toegewezen farmacotherapie weigert, en 13% de gecombineerde psycho- en farmacotherapie. Een langdurige behandeling vraagt een langdurig engagement van patiënt en therapeut voor de behandelvorm; een behandelvorm, die gekozen wordt voor deze patiënt en bij deze therapeut. Het zou weinig realistisch zijn dit van hen te vragen als de behandeltoewijzing door het toeval is bepaald.
Bovendien, als men er praktisch al in slaagt om de langdurige psychoanalyse te standaardiseren of te protocolleren en om op basis hiervan te bevorderen en te controleren of de therapeut overeenkomstig de voorschriften handelt, dan rijst de vraag of het kind niet met het badwater wordt weggegooid. Met andere woorden, is de volgens het protocol uitgevoerde behandeling nog wel een psychoanalyse?
In het geval van langdurige therapie dwingen dus ethische en praktische, en trouwens ook financiële beperkingen het onderzoek in de richting van de effectiviteitsmethode: naturalistisch onderzoek naar de effecten van een specifieke behandeling zoals die in de klinische praktijk wordt vormgegeven. Uitgaande van de zelfselectie van patiënten en de behandeltoewijzing in de praktijk, wordt dan het effect van een specifieke behandeling bestudeerd, dus zonder gerandomiseerde toewijzing van patiënten aan de experimentele behandeling, een placebo-conditie, wachtlijstcontrolegroep of concurrerende behandeling. Een statistische vergelijking van differentiële effecten is dan niet mogelijk.
Dit geldt bijvoorbeeld voor het Menninger Foundation Psychotherapy Research Project (Wallerstein, 1986). Hierin werden weliswaar verschillende behandelcondities (psychoanalytische psychotherapie en psychoanalyse) vergelijkend bestudeerd, soms zelfs met een follow-up van 12 tot 24 jaar, maar gerandomiseerde toewijzing had niet plaatsgevonden. We hebben dus eigenlijk te doen met twee parallelle naturalistische effectiviteitsstudies (Marschall, Vaughan, MacKinnon, Mellman & Roose, 1997). Dit geldt ook voor het onderzoek van Weber, Bachrach en Solomon (1985). Kantrowitz, Katz en Paolitto (1990) onderzochten vijf tot tien jaar na beëindiging het effect van één behandelvorm, te weten psychoanalyse. Hier was geen andere behandelvorm of controlegroep in het onderzoek betrokken.
Er is mij slechts één onderzoek bekend naar langdurige therapie, psychoanalytische psychotherapie en psychoanalyse, waarin tot op zekere hoogte wel kon worden voldaan aan de methodologische eis van de gerandomiseerde toewijzing aan twee of meer onderzoekscondities. Sandell, Blomberg en Lazar (1997) konden voor de randomisatie gebruikmaken van de onbedoelde gevolgen van een financieringsregeling voor langdurige psychotherapie in Zweden. Omdat het aantal indicaties het aantal gefinancierde plaatsen verre overtrof, werden patiënten, waarvoor in 1990 een psychoanalyse of een psychoanalytische psychotherapie werd geïndiceerd, gerandomiseerd toegewezen aan een wachtlijstcontrolegroep of aan de geïndiceerde behandelvorm. Vanwege het protest hiertegen, kon deze procedure niet worden volgehouden, en kregen de patiënten in de jaren daarop de geïndiceerde behandeling op volgorde van anciënniteit van hun positie op de wachtlijst. In wezen heeft dit echter niet afgedaan aan een gedeeltelijk gerandomiseerd onderzoeksdesign, waarin de psychoanalyse- en de psychoanalytische psychotherapiegroepen met hun respectievelijke wachtlijstcontrolegroep werden vergeleken. Het gaat hier dus eigenlijk om twee parallelle efficacy-studies.
Bij de eerste effectmeting in 1994 bleek echter dat slechts 10% van de patiënten uit de wachtlijstcontrolegroep zich overeenkomstig de toegewezen positie in het onderzoeksdesign had gedragen. Niet-behandeld stonden deze 10% van de patiënten nog steeds op de wachtlijst. De rest van de patiënten uit de wachtlijstconditie was in de tussentijd elders in, soms langdurige, therapie gegaan of zelfs al geweest, waaronder psychoanalyse. Door de lange duur van het onderzoeksproject – hoe kan het anders bij langdurige behandelingen – werd de gerandomiseerde toewijzing aan controle- en behandelgroep dus doorkruist met wat er in de loop van de tijd in de klinische werkelijkheid gebeurt. Ten tijde van de follow-up was de samenstelling van de vergelijkingsgroepen niet meer door het toeval bepaald, maar door zelfselectie van patiënten en door interventie van de hulpverlening. De kern van de efficacy-methode, randomisatie, had plaats gemaakt voor het naturalistische design van de effectiviteitsstudie.
In het langdurende onderzoek van langdurige therapie (Sandell e.a., 1997) heeft men de uiteindelijke samenstelling van de onderzoeksgroepen dus minder in de hand dan in het kortdurende onderzoek van kortdurende therapie (Elkin e.a., 1989). In het geval dat de lange onderzoekstermijn debet is aan de teloorgang van de randomisatie, dan moet dat ook naar voren komen in het geval dat het onderzoek van kortdurende behandelingen een lange termijn follow-up krijgt. Lange termijn follow-up van kortdurende therapie wordt echter niet zo vaak gedaan. Robinson, Berman en Neimeyer (1990) presenteren een statistische meta-analyse van 58 efficacy-studies van kortdurende therapie bij depressie (gemiddeld 8,7 zittingen; vier behandelvormen, te weten cognitieve therapie, gedragstherapie, cognitieve gedragstherapie en psychodynamische, client-centered of interpersoonlijke gespreks-therapie). Bij 24 van deze studies was de effectmeting beperkt tot het moment van therapiebeëindiging. Bij de overige 34 studies was de gemiddelde follow-up-periode 13 weken met een range van 2 tot 52.
Toch zijn er ook wel voorbeelden van langdurende follow-up van kortdurende therapie bij depressie. Ludgate (1994) noemt acht gecontroleerde studies met een follow-up van 1 tot 3 jaar. Het gaat hier om ambulante of opgenomen patiënten, en 12 tot 20 zittingen cognitieve gedragstherapie of gedragstherapie. Ten tijde van de follow-up blijkt dat ongeveer de helft van de oorspronkelijk gerandomiseerd toegewezen patiënten nog deel uitmaakt van de onderzoeksgroep. De rest heeft in de tussentijd, om wat voor reden dan ook, afgehaakt. Bovendien zijn er patiënten in de follow-up-groep die in de tussentijd opnieuw in behandeling gingen. Shapiro, Rees, Barkham, Hardy, Reynolds en Startup (1995) constateerden dat 27% van de patiëntengroep in de follow-up-periode van 1 jaar opnieuw in een of andere vorm van behandeling was gegaan. De randomisatie is dus gaandeweg de lange duur van het onderzoek uit het design verdwenen. Hollon en Beck (1994) constateren dan ook dat van naturalistisch follow-up-onderzoek gesproken moet worden. Bij lange termijn follow-up van kortdurende therapie is de efficacy-methode dus moeilijk vol te houden, evenzeer als bij het effectonderzoek naar langdurige therapie.
Terug naar het toonaangevende NIMH-depressieproject (Elkin, 1994). In 1992 werden de resultaten gepubliceerd van de follow-up na 18 maanden (Shea, Elkin, Imber, Sotsky, Watkins, Collins, Pilkonis, Beckham, Glass, Dolan & Parloff, 1992; Elkin, 1994). De onderzoekers vinden de behandelresultaten tegenvallen: «Het opvallendste van de resultaten van de follow-up is het relatief kleine percentage patiënten dat in behandeling blijft, volledig herstelt en dit ook blijft in de follow-up-periode van 18 maanden. Hoewel een directe vergelijking niet goed mogelijk is, lijkt dit percentage overeen te komen met wat in andere studies werd gevonden […]. Dit doet de vraag rijzen of de werkzaamheid van kortdurende behandelingen niet wordt overschat.» (Elkin, 1994, p. 127; vertaling Gomperts).
Slechts 20% van de 239 patiënten die de behandeling waren begonnen, bleek bij beëindiging symptoomvrij en bij follow-up niet teruggevallen. Bovendien was een derde van deze patiënten tijdens de follow-up-periode opnieuw in een of andere vorm van behandeling gegaan. De onderzoekers benadrukken dat een statistische vergelijking tussen de behandelcondities niet meer mogelijk is: «Statistische toetsingen werden niet uitgevoerd op de data uit de herstelde onderzoeksgroep vanwege de teloorgang van de randomisering en de mogelijkerheid van selectiviteit in de herstelde onderzoeksgroepen wat betreft de verschillende behandelingscondities.» ( Elkin, 1994, p. 127; vergelijk Shea e.a., 1992; vertaling Gomperts.). Het follow-up-gedeelte van het NIMH-depressieproject typeren de onderzoekers daarom als naturalistisch onderzoek. Het project is als toonaangevend efficacy-onderzoek begonnen, maar als effectiviteitsstudie geëindigd.
In effectonderzoek geldt kennelijk: zoveel efficacy-methode als mogelijk, en zoveel effectiviteitsmethode als nodig, al naar gelang de tijdsduur waarop het onderzoek betrekking heeft. In het korte-termijnonderzoek naar het korte-termijneffect van kortdurende therapie is meer efficacy-methode mogelijk dan in lange-termijneffectonderzoek, en in het lange-termijnonderzoek naar de effecten van langdurige therapie, en ook in het lange-termijnonderzoek naar het lange-termijneffect van kortdurende therapie, is meer effectiviteitsmethode nodig dan in korte-termijneffectonderzoek.
Wanneer het depressieprotocol de uitverkiezing van kortdurende psychotherapie beargumeert op grond van «aangetoonde werkzaamheid van kortdurende behandelingen, en het ontbreken van deugdelijk/vergelijkbaar onderzoek naar langdurige behandelingen», dan is dit dus een al te vereenvoudigde voorstelling van zaken. De argumentatie is slechts gebaseerd op het wetenschappelijk succes van het korte-termijnonderzoek naar de korte-termijneffecten van kortdurende therapie. Er wordt voorbijgegaan aan de methodologische problemen in vergelijkbaar (en dus efficacy-)onderzoek naar de effecten van langdurige therapie en naar de lange-termijneffecten van kortdurende therapie.
De klinische trial met gerandomiseerde toewijzing is de kracht van de efficacy-methode, maar dus ook de achilleshiel. Cuijpers (1997) wijst er bovendien op dat voordat de randomisatie plaatsvindt er vaak al een voorselectie van patiënten heeft plaatsgevonden. Deze selectie van patiënten beperkt de mogelijkheid om de resultaten van het efficacy-onderzoek te generaliseren naar de klinische praktijk. Er bestaat voor de onderzoekers de medisch-ethische verplichting de patiënten van tevoren over de randomisatie in te lichten en naar hun bereidheid te vragen aan het onderzoek mee te doen, bijvoorbeeld in ruil voor gratis behandeling. Over de zelfselectie van patiënten die dit teweegbrengt, wordt in onderzoek meestal niet gerept (De Jonghe & Wijn, 1996).
Daarnaast zouden onderzoekers, voorafgaand aan de randomisatie, sommige patiënten deelname aan de trial ontzeggen, bijvoorbeeld vanwege het risico van een acute crisissituatie, zoals in het geval van suïcidaliteit. Soms zou slechts 10% van de patiënten die tot deelname bereid zijn, worden geaccepteerd (Muñoz & Ying, 1993). Bovendien zijn mensen uit lagere sociaal-economische milieus en minderheidsgroepen ondervertegenwoordigd (Muñoz & Ying, 1993).
In het echte therapiebedrijf krijgen de patiënten niet op grond van randomisatie een behandeling toebedeeld, maar op grond van een ingewikkeld samenspel van zelfselectie en indicatiestelling. Bij psychoanalytische behandelvormen blijkt er een positieve samenhang te zijn tussen de klinische ervaring van de therapeut die de spreekuur- en onderzoeksgesprekken voert en de kans op een juiste indicatie. Dit laatste wil zeggen dat de patiënt in therapie komt en deze niet te vroeg afbreekt (Betz e.a., 1979; Epperson, 1981, Krauskopf e.a., 1981, in Beenen en Trijsburg, in voorbereiding). Als bovendien de motivatie van de patiënt voor de gekozen behandelvorm, zijn eigen inbreng in deze keuze en in de keuze van de therapeut van invloed blijkt op het effect van de behandeling, dan wordt in de klinische trial met gerandomiseerde toewijzing de invloed van zulke factoren gemaskeerd en dus stelselmatig onderschat. Hetzelfde geldt voor het geloof van de therapeut in de werkzaamheid van de gekozen therapievorm voor de betreffende patiënt, en de flexibiliteit van de therapeut in techniek en behandelduur.
Therapie richt zich in werkelijkheid vaak niet op één DSM-diagnose, maar op meerdere samenhangende problemen. Bovendien bestaat er een grote variatie aan patiënten binnen één AS-I-diagnose.
Wanneer we opnieuw teruggaan naar het NIMH-depressieproject, zien we dat Blatt, Quilan, Pilkonis en Shea (1995) op basis van een vervolganalyse aantoonden dat de mate van zelfkritisch perfectionisme (depressie in samenhang met zelfbestraffende en eisende introjecten) negatief correleert met het therapiesucces in alle vier de behandelcondities. Patiënten met een hoge mate van zelfkritisch perfectionisme zouden wel baat hebben bij langdurige intensieve psychodynamische therapie, waarbij vijfmaal in de week psychoanalyse het overigens beter deed dan tweemaal in de week (Blatt, 1992).
In een andere vervolganalyse van de gegevens uit het NIMH-depressieproject bleek de aanwezigheid van persoonlijkheidspathologie een negatieve samenhang te hebben met verschillende uitkomstmaten (Shea, Pilkonis, Beckham, Collins, Elkin, Sotsky & Docherty, 1990; vergelijk ook Thomson, Gallagher & Czirr, 1988), en in het geval van een ernstige depressie toonde een heranalyse van gegevens aan dat de conditie antidepressiva met steunend contact, effectiever was dan de twee psychotherapeutische behandelcondities (Elkin, Shea, Watkins, Imber, Sosky, Collins, Glass, Pilkonis, Leber, Dochery, Fiester & Parloff, 1995). De ene depressie is dus duidelijk de andere niet. Ook wat dit betreft is het depressieprotocol ongenuanceerd.
Het simplisme in het depressieprotocol bij de argumentatie voor de uitverkiezing van kortdurende therapie wordt in brede kring gemakkelijk overgenomen en kan grote gevolgen hebben voor de psychotherapeutische beroepsgroep, zowel intern in de verhouding tussen therapeuten van verschillende scholen, als extern in de verhouding met de overheid, zorgverzekeraars en patiënten. Het beperkte bruikbaarheidsbereik van de efficacy-methode blijkt vandaag de dag bijzonder profijtelijk voor therapeuten en onderzoekers die zich uitsluitend richten op de kortdurende therapievormen. De werkzaamheid van deze therapievormen wordt er immers succesvol mee aangetoond, en hoewel het weinig aandacht krijgt, is het alleen voor de korte-termijneffecten van de kortdurende therapievormen dat de efficacy-methode dit goed kan doen.
Het is onder meer vanwege dit laatste dat vooraanstaande therapie-onderzoekers, die tot voor kort de efficacy-methode als noodzakelijke voorwaarde voor wetenschappelijk effectonderzoek beschouwden, op deze methode zijn teruggekomen. Seligman (1995, p. 966) concludeert: ‘mijn overtuiging wat een gouden wetenschappelijke standaard is, is veranderd […]. Ik kwam tot het inzicht dat de vraag of de ene behandelvorm onder strikte onderzoekscondities het beter doet dan de andere, of een controleconditie, een heel andere is dan de vraag naar wat in de praktijk het beste werkt.’ (vertaling Gomperts).
Niet alleen de ethische en praktische problemen bij de toepassing van de efficacy-methode in het lange-termijnonderzoek naar de effecten van langdurige therapie, hebben tot deze heroriëntatie geleid. Het gaat ook om inhoudelijk-methodologische argumenten, die ook voor het effectonderzoek naar kortdurende behandelvormen gelden. Ondanks het voordeel van de methodologische zuiverheid, is de efficacy-methode dus volgens een toenemend aantal onderzoekers een te beperkte onderzoeksmethode, omdat zij tot klinisch weinig relevant onderzoek leidt (Howard, Orlinsky & Lueger, 1994; Garfield, 1996). Een ander citaat van Seligman (1995, p. 966): «Efficacy-onderzoek is de verkeerde methode om psychotherapie zoals in het veld plaatsvindt, te valideren omdat te veel wezenlijke kenmerken buiten beschouwing blijven.» (vertaling Gomperts). Goldfried en Wolfe (1996, p. 1010) schrijven: «We zijn gevangen geraakt in een onderzoeksparadigma dat de klinische werkelijkheid niet adequaat weerspiegelt. De op dit moment dominante onderzoeksmethodologie is de problemen gaan bepalen die men bestudeert.» (vertaling Gomperts).
Het beleid voor psychotherapie – dit is erkenning van deskundigheid en financiering en in het verlengde hiervan dus ook de financieel veilig gestelde behandelkansen van patiënten – wordt steeds meer gebaseerd op de resultaten van efficacy-studies. Daarom valt te vrezen dat indirect de methodologische gestrengheid van de efficacy-methode de klinische praktijk beperkingen gaat opleggen, waardoor opleiding en ervaring van therapeuten die anders dan kortdurend behandelen, niet meer ten volle worden benut, en waardoor patiënten, voor wie een langdurige behandelvorm nodig en mogelijk is, tekort worden gedaan.
In het bovenstaande is betoogd dat de wetenschappelijke argumentatie in het depressieprotocol simplistisch is. Bovendien zijn er aanwijzingen dat een en hetzelfde protocol voor alle depressieve patiënten ongenuanceerd is en dat de bestendigheid van het behandeleffect zou tegenvallen. Dit alles neemt niet weg dat er belangrijke empirische aanwijzingen zijn dat PKP voor veel patiënten werkzaam is, zowel qua klachtenreductie als verbetering van het algemeen welzijn.
Als de depressieve klachten verminderen en het algemeen functioneren verbetert, en als dit resultaat bovendien in maximaal 20 zittingen te bereiken is en stand houdt, wat kan hier dan op tegen zijn? Als hiermee de behandeldoelen zijn gegeven, is het antwoord: niets. Als men echter vindt dat ook andere doelstellingen tot het domein van de psychotherapie kunnen behoren, dan kan het antwoord zijn: veel.
Het antwoord hangt dus af van het gestelde behandeldoel. Een discussie over de effectiviteit van verschillende psychotherapeutische behandelvormen moet dus ook over doelstellingen gaan. Met de overheidsfinanciering en -erkenning van psychotherapie is deze discussie op het niveau van de samenleving in wezen een politieke. In de politiek moet immers uiteindelijk worden uitgemaakt wat men voor welke doelstellingen over heeft. Niet los hiervan, en dus ook met het oog hierop, wordt op het niveau van de psycho-therapeutische beroepsgroep deze discussie ook gevoerd. In samenhang met scholenstrijd en scholennijd speelt hier uiteraard ook het groeps- en eigenbelang. Op het niveau van de individuele patiënt gaat de doelstellingendiscussie over het moeilijke vaktechnische probleem van de differentiële indicatiestelling, en op het niveau van het effectonderzoek tenslotte moet worden uitgemaakt of een specifieke behandelvorm de beoogde doelstellingen daadwerkelijk bereikt.
Over de twee laatstgenoemde niveaus het volgende. In een psychotherapie gaat het uiteraard om klachtenreductie en verbetering van het algemeen welzijn. Soms echter is persoonlijkheidsverandering nodig en mogelijk, bijvoorbeeld om de klachtenreductie en de verbetering in het algemeen functioneren structureel te onderbouwen. Er zijn ook patiënten waarbij structurele persoonlijkheidsverandering nodig zou zijn om stagnaties in het functioneren op te heffen, met als bedoeld neveneffect een bestendige vermindering van klachten en symptomen. Een langdurige therapie, die overigens niet per se psychoanalytisch hoeft te zijn, is op het specifieke doel van de structurele verandering gericht. Het kan dan bijvoorbeeld gaan om versterking van het vermogen van de patiënt om zelf en ander, om fantasie en werkelijkheid te onderscheiden; impulsen te reguleren; ambivalenties te verdragen; conflicten op te lossen in de binnenwereld en met de buitenwereld; betekenisvolle relaties aan te gaan, maar ook alleen te kunnen zijn; en een coherent en realistisch zelfgevoel te ontwikkelen. Niet alle patiënten zijn echter gediend met de (langdurige) behandelmethoden die dit doel nastreven, en niet bij alle patiënten en therapeuten behoort dit doel tot de therapeutische mogelijkheden en wensen. Als de wens, noodzaak en mogelijkheden tot structurele verandering bij de patiënt echter wel bestaan, en bijvoorbeeld met de toepassing van het depressieprotocol niet voldoende zijn onderzocht, herkend en gehonoreerd, wordt de patiënt tekort gedaan.
Tenslotte, het is aan het psychoanalytische effectonderzoek om het specifieke veranderingseffect van de structurele verandering op empirisch-wetenschappelijk aanvaardbare wijze aan te tonen, dan wel aannemelijk te maken. En aanvaardbaar wil zeggen: zoveel efficacy-methode als mogelijk, zoveel effectiviteitsmethode als nodig.
Met dank aan Gerdine Veen, Christa Widlund-Broer en Paul van Woerden.