Eind 2013 ontving ik, tot mijn grote genoegen en verrassing, de eerste Wim Trijsburgprijs van de Nederlandse Vereniging voor Psychotherapie (NVP). De prijs werd mij toegekend vanwege mijn theoretische en empirische publicaties over de specifieke betekenis van de therapeutische relatie. Die prijs stimuleerde mij om een leerboek over relationele therapiemodellen te schrijven (Hafkenscheid, 2014), bestemd voor opleidingstherapeuten en supervisanten. Dit boek kan gebruikt worden in cursussen en supervisiesituaties, maar gaat nauwelijks (op één paragraaf na) over supervisie.
Over supervisie aan opleidingstherapeuten is in de Nederlandstalige psychotherapeutische vakliteratuur opvallend weinig geschreven. Dat geldt niet alleen voor supervisie over het hanteren van de therapeutische relatie, maar ook voor supervisie in meer algemene zin. De weinige publicaties over het onderwerp zijn vrijwel uitsluitend beschouwend van aard. Twee voorbeelden in dit tijdschrift uit de afgelopen paar jaar zijn Veeninga en Hafkenscheid (2010) en Baljon (2014). Een uitzondering op de beschouwende insteek is de publicatie van Peute (2010) in ‘Gedragstherapie’. Hij presenteerde de resultaten van zijn enquête onder aspirant-cognitief gedragstherapeuten (en voor een ander deel onder supervisoren) naar hoe zij de kwaliteit van supervisie ervoeren.
Uit dit verkennend onderzoek kwam naar voren dat aspiranten de supervisie en hun supervisoren positief beleefden. Supervisanten rapporteerden groei in hun professionele ontwikkeling. Dat supervisie door supervisanten (en hun supervisoren) positief wordt ervaren, is uiteraard geen waarborg dat therapeuten buiten de supervisie meer bekwaamheid aan de dag leggen, zoals zou moeten blijken uit bijvoorbeeld video-opnames van werkelijke therapiesituaties. Evenmin valt uit hun positieve gevoel af te leiden dat gesuperviseerde therapeuten dankzij de supervisie betere behandelresultaten boeken.
In elk van de drie genoemde Nederlandse publicaties wordt in een enkele zin aangestipt dat a onderzoek naar de effectiviteit van supervisie schaars is, en b er over de generalisatie van supervisie naar de klinische praktijk wetenschappelijk bezien nog weinig zinvols te zeggen valt. Inderdaad is de effectiviteit van supervisie aan opleidingstherapeuten een nog grotendeels onontgonnen onderzoeksgebied. Wie zich verdiept in de internationale onderzoeksliteratuur uit de afgelopen decennia komt niet veel onderzoek tegen naar de impact van training of supervisie op het proces en de uitkomsten van psychotherapie.
Toch blijken er wel degelijk interessante empirische studies te vinden. Een deel van die studies spitst zich toe op training in en supervisie over het ‘managen’ van de therapeutische relatie, en dan met name het repareren van alliantiebarsten. Safran e.a. (2011a, 2011b) hebben de uitkomsten van deze studies recentelijk in een meta-analyse samengevat. Een ander deel richt zich op supervisie in bredere zin, dus niet specifiek op supervisie over de therapeutische relatie aan psychotherapeuten. Recente meta-analyses van Watkins (2011) en Reiser en Milne (2014) hebben betrekking op supervisie met een heel uiteenlopende inhoud (bijvoorbeeld supervisie over oplossingsgericht werken, over cognitieve gedragstherapie of over empathisch reageren), aan nogal diverse professies in de geestelijke gezondheidszorg (niet alleen aan psychotherapeuten in opleiding, maar ook aan bijvoorbeeld verpleegkundigen of psychiaters in opleiding).
Het doel van dit artikel is om de stand van zaken van het empirisch onderzoek naar de effecten van training in en supervisie over het hanteren van de therapeutische relatie te peilen. Daar is alle reden voor. Er is steeds meer empirische evidentie dat de persoon van de therapeut, waaronder met name relationele vaardigheden (zoals de vaardigheid van de therapeut om alliantiebarsten te repareren), bepalend zijn voor het welslagen van psychotherapeutische behandelingen (Norcross, 2011). Een belangrijke vraag is dan of supervisie en training helpen om persoonlijke kenmerken van de therapeut (zoals omgangsstijl) zodanig te veranderen, dat de therapeut de therapeutische relatie beter kan hanteren en een effectievere hulpverlener wordt.
Een verwante vraag is of relationele vaardigheden van therapeuten door supervisie of training toenemen, en of toegenomen relationele vaardigheden leiden tot betere therapieresultaten. Training en supervisie zijn niet identiek. Training wordt in de regel cursorisch en groepsgewijs aangeboden en richt zich op het aanleren van therapeutische vaardigheden in een simulatieomgeving (bijvoorbeeld rollenspelsituaties met acteurs die bepaald patiëntgedrag presenteren, waarin de trainee oefent met adequate therapeutreacties). Supervisie wordt individueel of in kleine groepen aangeboden en richt zich op de omgang met echte patiënten in voor de supervisant moeilijke praktijksituaties, waarin de persoon van de opleidingstherapeut en diens vaardigheden (of vaardigheidstekorten) altijd tot op zekere hoogte in het geding zijn. In dit artikel zullen training en supervisie niet strikt worden onderscheiden. Het onderscheid wordt namelijk in onderzoekspublicaties zelf niet consequent gemaakt; training en supervisie werden veelal in combinatie aangeboden en onderzocht.
De zogenaamde Vanderbilt-studies I en II (o.a. Bein e.a., 2000; Strupp & Hadley, 1979) behoren tot de eerste onderzoeken naar de effecten op de behandelprestaties van psychotherapeuten, door hen te trainen in specifieke therapeutische vaardigheden en technieken. De studies zijn genoemd naar de Vanderbilt-universiteit in Nashville (Tennessee), waar ze in de jaren zeventig (de eerste studie) en tachtig (de tweede studie) van de vorige eeuw werden uitgevoerd onder leiding van Hans Strupp (1921-2006), een pionier op het gebied van onderzoek naar de processen en effecten psychotherapie. Beide studies zijn fraai beschreven door Binder en Henry (2010), destijds leden van het onderzoeksteam.
De Vanderbilt-studie I was geen studie naar het effect van training en supervisie, maar vormde wel de noodzakelijke opstap naar de tweede Vanderbilt-studie. De eerste studie richtte zich op de vraag wat therapeutische techniek verhoudingsgewijs bijdraagt aan behandelresultaat, ten opzichte van aspecifieke relationele factoren (zoals het vermogen van de hulpverlener om een warme en steunende relatie te bieden). Die vraag werd onderzocht in een steekproef van patiënten (universiteitsstudenten) die voor psychische hulp hetzij werden toegewezen aan een professionele therapeut (onderzoeksgroep), hetzij aan een universiteitsdocent (vergelijkingsgroep). De therapeuten waren ervaren en stonden binnen hun beroepsgroep bekend als uiterst vakbekwaam. De universiteitsdocenten hadden geen therapeutische opleiding en werden geselecteerd op basis van hun reputatie onder studenten op relationeel gebied.
De hypothese was dat patiënten in de onderzoeksgroep, die kortdurende psychodynamische psychotherapie ontvingen van een professional, het er beter vanaf zouden brengen dan de patiënten in de vergelijkingsgroep. De therapeuten zouden immers moeten beschikken over zowel technische als relationele vaardigheden, terwijl de universiteitsdocenten uitsluitend aangewezen waren op hun relationele vaardigheden. De onderzoeksresultaten wezen uit dat deze hypothese moest worden verworpen: de universiteitsdocenten bleken in effectiviteit als hulpverlener gemiddeld niet onder te doen voor de ervaren en vakbekwame therapeuten. Bij nadere analyse kwam er een ander verschil aan het licht: de universiteitsdocenten waren bij elke patiënt ongeveer even (middelmatig) effectief, terwijl de therapeuten bij sommige patiënten zeer effectief waren en bij een andere juist heel ineffectief. Met name bij niet erg gemotiveerde patiënten met een hoog weerstandsniveau bleken de therapeuten verstrikt te raken in een negatieve communicatieve spiraal.
Uit de resultaten van de eerste Vanderbilt-studie concludeerden Strupp en zijn team dat het een doodlopende weg zou zijn om te blijven proberen (aspecifieke) relatiefactoren ten opzichte van (specifieke) therapeutische technieken uiteen te rafelen. Veel zinvoller leek het om relatiefactoren en techniek te benaderen als een onafscheidelijk, met elkaar verweven, duo. Het onderzoeksteam begon het hanteren van de therapeutische relatie te zien als techniek op zichzelf: een techniek die een hoog niveau van competentie vereist. De therapeuten in de Vanderbilt I -studie hadden zich verrassend onbeholpen betoond in de omgang met negatieve overdrachtsreacties van hun patiënten. Ze bleken daarnaast niet goed in staat om destructief verlopende interactiepatronen in de therapeutische relatie om te buigen naar een meer constructieve communicatie.
De tweede Vanderbilt-studie gebruikte een gestructureerde vorm van kortdurende psychodynamische psychotherapie, die in het bijzonder geschikt werd geacht voor patiënten die niet tot volgzaamheid en samenwerking waren geneigd. De studie richtte zich daarom niet alleen op specifiek psychodynamische technieken (zoals het adequaat leren duiden van overdrachtsthema’s), maar vooral ook op het oefenen en vertrouwd raken met technieken om de therapeutische relatie te optimaliseren (zoals aandachtig luisteren of het opbouwen van een vertrouwensrelatie). Aan deze tweede studie namen 16 therapeuten (8 klinisch psychologen en 8 psychiaters) en 64 patiënten deel. De therapeuten waren gecertificeerd en relatief ervaren. Ze hadden onder collega’s een goede naam. Alle patiënten hadden een as-I-stoornis conform de DSM-III (meestal een angststoornis of een depressieve stoornis), en het merendeel (66%) had een stoornis op as II (7% binnen cluster A of cluster B, 22% binnen cluster C, 38% gemengde persoonlijkheidsproblematiek of anderszins).
Het onderzoek kende drie fasen. In de eerste fase (baseline) behandelde elke therapeut twee patiënten (16 × 2) volgens zijn gebruikelijke aanpak. Per therapeut had de ene patiënt een gunstige prognose en de andere een ongunstige. De tweede fase bestond uit een wekelijks trainingsprogramma over een periode van twaalf maanden. In deze fase behandelde elke therapeut een patiënt volgens het aan te leren therapiemodel. De trainingsbijeenkomsten bestonden voor een deel uit theoretische bijscholing en voor het andere deel uit supervisie over de in deze fase behandelde patiënten. In de derde fase, volgend op het trainingsprogramma, kreeg elke therapeut twee nieuwe patiënten (16 × 2) in behandeling. Wederom werd elke therapeut een patiënt met een gunstige en een patiënt met een ongunstige prognose toegewezen.
De hypothese was dat gerichte training (en supervisie) in een therapiemodel met een sterke focus op de therapeutische relatie een toename in effectiviteit teweeg zou brengen, en dan vooral bij patiënten met een slechte prognose. Zoals te verwachten viel, was er na de training een verschuiving op procesniveau, in de zin dat therapeuten meer gebruik maakten van overdrachtsduidingen. De uitkomsten van de tweede studie waren echter wederom - net als die van de eerste Vanderbilt-studie - teleurstellend. Het cohort patiënten dat na de training was behandeld, bleek geen betere therapieresultaten te behalen dan het cohort patiënten dat vóór de training was behandeld. Nadere analyses legden bloot dat therapeuten na de training zelfs slechter in staat bleken om negatief verlopende communicatiepatronen binnen de therapie een constructieve wending te geven. (Verderop wordt nader ingegaan op de theoretische verklaring van deze bevinding.)
De Vanderbilt-studies I en II waren baanbrekend in hun gedegen en systematische opzet, en sensationeel door hun verrassende resultaten. In de twee studie werden de therapeuten vergeleken met zichzelf. Een controlegroep van ongesuperviseerde/ongetrainde therapeuten ontbrak. Een zwakte van dit onderzoeksdesign is ‘natuurlijke groei’ (maturation): de mogelijkheid dat therapeuten simpelweg door meer klinische ervaring (en niet per se door het toevoegen van training en supervisie) na verloop van tijd betere behandelresultaten boeken. ‘Natuurlijke groei’ kan als concurrerende verklaring - of als storende ‘derde variabele’ - dus niet worden uitgesloten.
De resultaten van de tweede studie wezen overigens geenszins op natuurlijke groei; integendeel. Dat laat onverlet dat het niet controleren op deze potentiële confounder een methodologische zwakte van dit onderzoek is. Ondanks deze zwakte kan de Vanderbilt-studie II beschouwd worden als het fundament voor later empirisch onderzoek naar de impact van training en supervisie van therapeuten op het bevorderen van een optimale therapeutische relatie.
Twee recentere studies zijn die van Crits-Christoph e.a. (2006) en die van Safran e.a. (2005). De eerste studie is in zekere zin een replicatie van de Vanderbilt-studie II. De tweede is in meer afgeleide zin van belang voor de vraag of training en supervisie behandelaars effectiever maken, namelijk door het voorkomen van voortijdige uitval (drop-out) van patiënten. De studie van Crits-Christoph e.a. (2006) wordt door Crits-Christoph e.a. (2010) kritisch besproken.
Proefpersonen in de studie waren vijf therapeuten met één tot drie jaar postdoctorale ervaring. Zij werden getraind in een zestien sessies omvattend behandelmodel voor depressieve patiënten, bestaande uit enerzijds een combinatie van psychodynamische en interpersoonlijke interventies en anderzijds technieken om de therapeutische relatie te optimaliseren. Elke therapeut behandelde negen patiënten: drie patiënten voordat de training begon, drie andere patiënten tijdens de periode van de training en nog eens drie andere patiënten nadat de training was afgesloten. In het onderzoek werden zowel procesmaten als uitkomstmaten gebruikt. Als procesmaten werden twee alliantievragenlijsten gebruikt, die aan het eind van elke sessie door de patiënt werden ingevuld. Een zelfbeoordelingsschaal voor depressie en een schaal voor kwaliteit van leven dienden als uitkomstmaten. Naast voor- en nametingen was er een follow-up.
De proefgroep was klein, waardoor het statistisch onderscheidingsvermogen van deze pilotstudy erg klein was. Voor geen van beide alliantiematen en evenmin voor de uitkomstmaten werden statistisch significante verschillen tussen de drie stadia (voor de training, tijdens de training en na de training) gevonden. Niet-significante veranderingen kunnen desondanks betekenisvol zijn, uitgedrukt in effectgrootte. Dat bleek in dit onderzoek het geval. De vijftien patiënten die na de training werden behandeld beoordeelden de alliantie beter dan de vijftien patiënten die voor de training werden behandeld. De gevonden verschillen waren middelgroot.
Ook op beide uitkomstmaten werden enkele betekenisvolle uitkomsten gevonden, die ondersteunend waren voor het idee dat training therapeuten helpt om betere behandelresultaten te boeken. In de vergelijking tussen a de patiënten die vóór de training in behandeling waren, met b patiënten die tijdens of c na de trainingsfase werden behandeld, werd een klein tot middelgroot effect gevonden voor de depressiescores bij afsluiting van de behandeling, en eveneens een klein tot middelgroot effect bij de vergelijking tussen a en c bij de follow-up-meting. Voor de schaal voor kwaliteit van leven werd een groot effect in de verwachte richting gevonden bij de vergelijking tussen de patiëntengroep die tijdens de training werd behandeld, ten opzichte van patiënten die voor de training werden behandeld.
De vijf therapeuten profiteerden in heel uiteenlopende gradatie van de training. Wat betreft de kwaliteit van de alliantie gingen drie therapeuten in uiteenlopende mate vooruit van voor naar na de training, een therapeut verslechterde en herstelde daarna weer en voor de vijfde therapeut had de training hoe dan ook een negatieve uitwerking. De uitkomsten van dit onderzoek waren al met al wat gunstiger dan die van de VanderBiIt-studie II. Net als in de VanderBiIt-studie II werden de therapeuten in het onderzoek Crits-Christoph (2006, 2010) met zichzelf vergeleken, waardoor niet gecontroleerd kon worden voor natuurlijke groei (maturation).
Safran e.a. (2005) verrichtten hun studie binnen het opleidings- en onderzoeksprogramma van het Beth Israel Medical Centre te New York. Intensieve supervisie en training zijn een vast onderdeel van dit onderzoeksprogramma. In totaal 32 opleidingstherapeuten participeerden in hun onderzoek. Deze therapeuten behandelden in totaal zestig patiënten met veelal zowel as-I- als as-II-problematiek conform de DSM-IV-TR. De op as II geclassificeerde persoonlijkheidsproblematiek voldeed voor het merendeel van de patiënten slechts gedeeltelijk aan de kenmerken van een afgebakende persoonlijkheidsstoornis (niet anders omschreven) en voor de overige patiënten viel de persoonlijkheidsproblematiek binnen cluster C. Dertig patiënten werden behandeld met kortdurende psychodynamische psychotherapie, de andere dertig met cognitieve gedragstherapie (CGT).
De auteurs ontwikkelden vooraf een actuarieel monitorsysteem, waarmee tussentijds kon worden vastgesteld of patiënten een verhoogd risico liepen op het mislukken van de behandeling. Na acht behandelcontacten werden met dit systeem achttien patiënten met een verhoogd risico op voortijdige uitval geïdentificeerd: dertien patiënten die kortdurende psychodynamische psychotherapie ontvingen en vijf die met CGT waren gestart. Deze patiënten kregen het aanbod van een andere therapeutische benadering voor het vervolg van hun behandeling. Voor dat vervolg werd er een derde behandelmogelijkheid toegevoegd: behandeling volgens het resolutiemodel voor alliantiebarsten van Safran en Muran (2000; zie ook Hafkenscheid, 2014). Tien patiënten maakten van het aanbod gebruik.
Een wisseling impliceerde niet alleen een verandering van therapeutische benadering, maar daarmee automatisch ook een verandering van therapeut. De tien patiënten die voor verandering kozen werden at random verdeeld over twee condities van elk vijf patiënten. In de onderzoeksconditie bestond het vervolg uit een behandeling conform het resolutiemodel, in de controleconditie uit hetzij kortdurende psychodynamische psychotherapie (als de patiënt eerder met CGT was behandeld), hetzij uit CGT (als de patiënt was begonnen met psychodynamische psychotherapie). Een van de belangrijkste uitkomstmaten was voortijdige uitval (drop-out).
Alle vijf patiënten in de controlegroep vielen voortijdig uit en datzelfde gold voor zeven van de acht patiënten die hadden afgezien van de wisseling van therapeutische aanpak. Daarentegen was er slechts één drop-out in de onderzoeksconditie. Een andere patiënt in de onderzoeksconditie met een goed lopende behandeling moest deze behandeling overigens om externe redenen voortijdig afbreken (vanwege een verre verhuizing).
Deze pilotstudy richtte zich niet rechtstreeks op de toegevoegde waarde van training en supervisie voor behandeluitkomst. Toch suggereert het belangrijkste resultaat van dit onderzoek dat opleidingstherapeuten geholpen kunnen worden om voortijdige uitval van ‘hoogrisico’patiënten te voorkomen, door hen te laten werken met en hen te superviseren conform het resolutiemodel voor alliantiebarsten.
Safran e.a. (2011a, 2011b) beoordeelden in hun meta-analyse acht studies die zich op een of andere wijze richten op de vraag of training in en/of supervisie in het repareren van alliantiebarsten tot betere therapieresultaten leidt. Alle studies verschenen vanaf 2000. De meta-analyse beperkte zich tot uitkomstvariabelen (zoals klachtenvermindering en een betere kwaliteit van leven). Het effect van het repareren van alliantiebarsten op de therapeutische relatie als tussentijdse uitkomst bleef buiten beschouwing. Twee hierboven besproken studies, die van Crits-Christoph e.a. (2006, 2010) en de Vanderbiltstudie II (Bein e.a., 2000; Binder & Henry, 2010), voldeden tevens aan de inclusiecriteria.
In deze twee studies dienden therapeuten, zoals gezegd, als hun eigen controlegroep. Anders gezegd: dezelfde therapeuten behandelden voor de interventie andere patiënten dan na de interventie. Daarmee weken deze twee studies af van vijf andere studies in de meta-analyse. In deze andere studies bestond de controleconditie uit andere therapeuten (en andere patiënten) dan in de onderzoeksconditie. In de achtste studie werd het effect van de interventie simpelweg gemeten door de ernst van de psychopathologie bij dezelfde patiënten, behandeld door dezelfde therapeuten, voor en na de supervisie of training te vergelijken. De effecten van training of supervisie werden in de meta-analyse op verschillende conservatieve wijzen benaderd, bijvoorbeeld door de twee studies die grote effectgrootten rapporteerden buiten de analyse te laten of door de analyse te beperken tot de studies die met een between-groups design (dus met een afzonderlijke controlegroep) werkten.
Ongeacht de analysestrategie bleek uit de meta-analyse dat therapeuten die getraind en/of gesuperviseerd werden in het repareren van alliantiebarsten statistisch significant betere resultaten boekten op gestandaardiseerde uitkomstmaten dan therapeuten in controlecondities, die zulke training of supervisie niet hadden ontvangen. De gevonden verschillen in het voordeel van alliantietraining waren weliswaar significant, maar in termen van effectgrootte nogal klein.
Niet bij elke patiënt heeft het repareren van alliantiebarsten als therapeutische vaardigheid dezelfde relevantie. Safran e.a. (2011a, 2011b) noemen als een van de beperkingen van de gescreende studies dat geen specifieke aandacht uitging naar de subgroep van patiënten voor wie specifieke alliantietraining in termen van het leren repareren van alliantiebarsten het meest relevant is: patiënten die een hoge moeilijkheidsgraad hebben doordat ze veel en forse alliantiebarsten genereren.
Een tweede actuele overzichtsstudie naar de vraag of supervisie bijdraagt aan betere behandeluitkomsten is die van Watkins (2011). De meta-analyse van Watkins (2011) is gericht op een veel bredere vraag dan die van Safran e.a. (2011a, 2011b). Zijn meta-analyse bestrijkt alle soorten supervisie over psychologische interventies binnen de ggz, dus niet specifiek supervisie in het repareren van alliantiebarsten. Dat verklaart waarom Watkins (2011) twee keer zoveel studies kon includeren als Safran e.a. (2011a, 2011b). De twee meta-analyses overlappen slechts met één studie, wat mogelijk mede verklaard kan worden doordat de meta-analyse van Safran e.a. (2011a, 2011b) zich zowel richt op supervisie als op training, terwijl Watkins (2011) zich beperkt tot supervisie.
Voor zijn meta-analyse vond Watkins (2011) achttien empirische effectonderzoeken naar supervisie tussen 1981 en 2011; een periode van dertig jaar.
Zeven van die achttien onderzoeken moesten bij nader inzien afvallen, omdat systematische metingen van behandeleffecten ontbraken of omdat de onderzochte interventie niet bestond uit supervisie, maar louter uit vaardigheidstraining. Nadat ook andere studies om diverse methodologische redenen moesten worden uitgesloten, bleven er uiteindelijk niet meer dan drie effectonderzoeken over, waarvan er twee een positief verband aantoonden tussen enerzijds het geven van supervisie en anderzijds de mate van klinische verbetering bij de patiënt. In één van die drie onderzoeken (Bambling e.a., 2006) was het effect van supervisie op de therapeutische alliantie (vanuit het perspectief van de patiënt) een van de uitkomstcriteria en dat effect was positief.
Watkins (2011) stelt vast dat we in dertig jaar nauwelijks progressie hebben geboekt bij de beantwoording van de vraag of supervisie de patiënt helpt, en niet alleen de gesuperviseerde therapeut. Er is ruimschoots evidentie voor de gunstige effecten van supervisie op de gesuperviseerde therapeuten, in de zin van onder meer een versterkt competentiegevoel en een verhoogd kennisniveau bij de supervisant. Het is echter heel wat kariger en problematischer gesteld met de empirische evidentie voor de gunstige effecten van training en supervisie op waar het per saldo om gaat: dat supervisie en training uiteindelijk ten bate komt van de patiënt, in de vorm van betere behandelresultaten. Watkins (2011) toont zich kritisch over het standpunt dat het een bijna onmogelijke opgave is om de invloed van supervisie op behandelresultaat (outcome) goed te kunnen onderzoeken. Hij bespreekt drie in zijn ogen ideaaltypische studies (waarvan twee met verpleegkundige behandelaars binnen de ggz), die dit standpunt loochenstraffen.
Een derde up-to-date meta-analyse werd uitgevoerd door Reiser en Milne (2014). Deze auteurs volgen Watkins (2011) in zijn opvatting dat supervisie haar waarde uiteindelijk pas bewijst als gesuperviseerde behandelingen daadwerkelijk effectiever blijken te zijn dan ongesuperviseerde behandelingen, bijvoorbeeld in de zin van een grotere mate van klachtenvermindering, een bevredigender interpersoonlijk functioneren of een betere kwaliteit van leven. Het is volgens deze auteurs verleidelijk, maar onterecht om onderzoek naar hoe het supervisieproces precies vorm en inhoud krijgt, ondergeschikt te maken aan onderzoek naar de vraag of supervisie uiteindelijk ten bate is van de patiënt. Reiser en Milne (2014) waarschuwen er dus voor om het effectonderzoek naar supervisie al te eenzijdig resultaatgericht te benaderen. De interne validiteit van zulk onderzoek staat volgens hen namelijk op losse schroeven, wanneer in onderzoek naar de effectiviteit van supervisie weinig aandacht wordt besteed aan de precieze aard en inhoud van de geboden supervisie.
Anders dan de twee zojuist besproken meta-analyses richt deze derde meta-analyse zich primair op de vraag in hoeverre de interventie als verklarende variabele in de effectonderzoeken helder en eenduidig zijn beschreven. Alleen bij een nauwgezette beschrijving van de interventie (zoals aantal en duur van de supervisiesessies) is het immers zinvol om therapieresultaten aan de interventie (supervisie) toe te schrijven.
De inclusiecriteria voor de meta-analyse van Reiser en Milne (2014) zijn grotendeels identiek aan die van Watkins (2011), maar ook iets restrictiever: uiteindelijk blijven er twaalf effectonderzoeken over. Negen studies overlappen met Watkins (2011) en de auteurs konden zelf nog drie andere relevante onderzoeken toevoegen. Elk onderzoek werd beoordeeld op vijf criteria. Het vijfde criterium was de aanwezigheid van kwantitatieve metingen van de uiteindelijke uitkomst (te weten de mate van klinische verbetering bij de patiënt). Dit vijfde criterium was een voorwaarde om een studie op te nemen in hun meta-analyse. Aan dat criterium voldeed dus 100 procent van de studies in de meta-analyse. Verandering van de kwaliteit van de therapeutische relatie door supervisie werd niet meegeteld als tussentijdse uitkomstmaat, omdat dit volgens de auteurs eerder een procesvariabele is.
De andere vier criteria voor deze meta-analyse waren a voldoende informatie over de inrichting van de supervisie (naast aantal en duur van de supervisiesessies, bijvoorbeeld spreiding van de supervisiesessies over de tijd en concrete beschrijving van het supervisiemodel), b voldoende informatie over de training van de supervisoren (beschrijving van hun opleidingsprogramma, beschrijving van hoe hun supervisorvaardigheden op peil werden gehouden, enzovoort), c voldoende informatie over het aanbieden van de supervisie (het gebruik van een zo optimaal mogelijk gestandaardiseerd supervisieprotocol, checken of en in hoeverre de supervisor zich aan dat protocol houdt, enzovoort), en d voldoende informatie over wat de supervisie met de supervisanten doet (zoals vaststellen of supervisanten daadwerkelijk het inzicht en de vaardigheden hebben verworven waarop de supervisie zich richt).
Niet meer dan drie van de twaalf studies in de meta-analyse scoorden op alle vijf criteria voldoende. Met name het vierde criterium scoorde zwak: slechts vier studies rapporteerden op een adequate manier of en hoe de geboden supervisie bij de gesuperviseerde therapeuten ook aanwijsbaar de beoogde toename in inzicht en in vaardigheden tot stand had weten te brengen.
Vanwege hun aandacht voor competentie en competentiebevordering bij therapeuten verdienen drie recente studies nadere bespreking. De eerste twee studies zijn kwantitatief en hebben betrekking op opleidingstherapeuten, de derde studie is kwalitatief en maakte gebruik van gecertificeerde therapeuten.
De eerste recente studie vond plaats binnen het opleidings- en onderzoeksprogramma van het Beth Israel Medical Centre. Kaplowitz e.a. (2011) onderzochten of emotionele intelligentie (EI) invloed heeft op de kwaliteit van het therapeutische alliantie en op de effectiviteit van psychotherapeutische behandeling, in termen van klachtenvermindering en een beter interpersoonlijk functioneren. EI werd gemeten met de Mayer-Salovey-Caruso EI Test (MSCEIT; Mayer e.a., 2002). De MCEIT onderscheidt vier dimensies: a het vermogen om emoties waar te nemen (perceiving), b het vermogen om emoties in het denkproces te integreren (integrating), c het vermogen om (de relatie tussen en de intensiteit van) emoties te begrijpen (understanding; woede in combinatie met walging impliceert bijvoorbeeld minachting; ergernis kan oplopen tot boosheid en uitmonden in woede of razernij), en d het vermogen om eigen emoties en de emoties van de ander adequaat te reguleren (managing). Deze vier dimensies leveren een EI-totaalscore op.
De MSEIT is een prestatietest, vergelijkbaar met een gewone intelligentietest. Deze meetmethode is daarmee minder gevoelig voor vertekeningen (zoals sociale wenselijkheid), dan het geval is voor subjectieve beoordelingen op zelfbeoordelingsvragenlijsten. Binnen de psychotherapeutische context zien auteurs de door de therapeut behaalde EI-scores als indicatief voor diens relationele vaardigheden: hoe hoger de scores, des te groter de capaciteiten van de therapeut om de therapeutische relatie goed te hanteren (bijvoorbeeld door alliantiebarsten tijdig op te merken en deze vaardig te repareren).
Elk van de 23 opleidingstherapeuten die in het onderzoek waren opgenomen nam deel met één patiënt en elke patiënt werd binnen een dertig sessies omvattend protocol behandeld, hetzij met een psychodynamisch georiënteerde relationele therapeutische benadering, hetzij middels CGT. De opleidingstherapeuten ontvingen in aanvang training in de therapeutische benadering die zij hanteerden en werden verder gedurende het hele onderzoekstraject wekelijks gesuperviseerd, aan de hand van video-opnames van behandelcontacten. De aan het onderzoek deelnemende patiënten waren, voor zover er persoonlijkheidsproblematiek was vastgesteld, voornamelijk geclassificeerd binnen cluster C.
Bijna de helft (n = 10) van de therapeuten onderging de test voor emotionele intelligentie nadat zij de behandeling van deze patiënt hadden afgesloten, de andere helft (n = 13) werd voor de start van de behandeling aan de test onderworpen. Dit was geen bewuste keuze, maar domweg een gevolg van het feit dat de MSEIT pas later in het onderzoeksprogramma werd geïmplementeerd. Omdat emotionele intelligentie wordt verondersteld een stabiel persoonlijkheidskenmerk te zijn, zou het moment dat de MSEIT wordt afgenomen volgens de onderzoekers geen noemenswaardige invloed mogen hebben op de behaalde intelligentiescores. Bij empirische toetsing werden inderdaad geen significante verschillen gevonden tussen de subgroepen wat betreft de hoogte van hun EI-prestaties.
De kwaliteit van de alliantie werd uitsluitend in de eerste fase van de therapie (de eerste zes sessies) gemeten en uitsluitend vanuit het perspectief van de patiënt. Zowel patiënt als therapeut vulden diverse uitkomstmaten in, waarbij een vragenlijst voor interpersoonlijke problemen vanuit beide perspectieven werd beantwoord. Vanuit het beoordelingsperspectief van de patiënt bleek, van de vier MSCEIT-dimensies, alleen een sterker vermogen van de therapeut om eigen emoties en de emoties van de ander adequaat te reguleren (managing) op statistisch significant niveau positief geassocieerd met de mate van klachtenafname. De door de patiënt ervaren kwaliteit van de therapeutische alliantie bleek geen enkele relatie te hebben met de hoogte van de emotionele intelligentiescores van de therapeut op een van de vier dimensies.
Voor het beoordelingsperspectief van de therapeut bleken a het vermogen van de therapeut om emoties in het denkproces te integreren (integrating), en b diens vermogen om (de relatie tussen en de intensiteit van) emoties te begrijpen (understanding) positief en significant geassocieerd met klachtenvermindering en een beter interpersoonlijk functioneren.
EI wordt beschouwd als een stabiel persoonlijkheidskenmerk en aan het eind van hun publicatie speculeren de onderzoekers over de (on)mogelijkheid om de EI-scores van therapeuten middels gerichte training te verbeteren. De studie van Kaplowitz e.a. (2011) geeft niet meer dan een heel voorlopig en voorzichtig bevestigend antwoord op de vraag of stabiele en reeds aanwezig veronderstelde relationele vaardigheden (gereflecteerd in de EI-scores) van de therapeut een positieve uitwerking hebben op het resultaat van psychotherapie. De studie laat weliswaar geen uitspraken toe over de relatie tussen training en/of supervisie enerzijds en effectiviteit van behandeling anderzijds, maar is van belang in verband met de vraag of therapeuten geholpen kunnen worden om hun EI te verhogen en daarmee effectiever te worden in hun therapeutisch werk.
In een tweede recente studie werd de invloed van supervisie over of training in relationele vaardigheden op de kwaliteit van het therapeutisch proces wel rechtstreeks onder de loep genomen. Binnen hetzelfde onderzoeksprogramma (maar in een andere steekproef van opleidingstherapeuten) onderzochten Safran e.a. (2014) of training in en supervisie over het hanteren van therapeutische relatie het interpersoonlijke gedrag van opleidingstherapeuten over de loop van de behandeling in gunstige zin veranderde. Zij noemen hun trainingsmodel/supervisiemodel Alliance-Focused Training (AFT).
Alle 22 aan het onderzoek deelnemende patiënten waren volgens de DSMIV-criteria geclassificeerd met een persoonlijkheidstoornis binnen cluster C, in op drie na alle gevallen gecombineerd met een angststoornis en/of een stemmingsstoornis. De proefpersonen waren 22 therapeuten in opleiding, die voorafgaand aan het onderzoek gedurende twintig weken training in de cognitieve gedragstherapie (CGT) hadden ontvangen en in die periode hun eerste patiënt met CGT hadden behandeld. In de onderzoeksfase startte elke therapeut met een tweede cognitief gedragstherapeutische behandeling, op basis van een dertig sessies omvattend protocol. De supervisie en training waren aanvankelijk uitsluitend cognitief gedragstherapeutisch van aard en inhoud. De helft van de therapeuten switchte wat betreft supervisie en training vanaf de achtste behandelsessie van CGT naar AFT, de andere helft pas vanaf de zestiende behandelsessie.
Met dit multiple baseline design werd gecontroleerd voor meer banale verklaringen van veranderend interpersoonlijk gedrag van de therapeut over de loop van de behandeling (zoals toegenomen ervaring met de behandelmethode en een toegenomen bekendheid met de patiënt). De onderzoekers voorspelden onder meer dat therapeuten hun patiënten na de switch in supervisie en training meer empathische bevestiging en begrip zouden bieden, hen meer ruimte zouden geven voor autonoom gedrag en meer zelfonthullingen zouden aandurven. Wat betreft de patiënten voorspelden zij parallelle veranderingen (zoals toegenomen zelfonthulling door patiënten na de introductie van AFT). Waar de CGT naar het oordeel van de therapeut duidelijk werkzaam was, werd de therapeut aangemoedigd om ook na de switch in supervisiebenadering cognitief gedragstherapeutisch te blijven werken. Bleek de CGT problematisch, dan werd de therapeut na de switch aangemoedigd om juist meer interpersoonlijk te gaan werken en de CGT-benadering zo nodig zelfs geheel te verlaten.
Interpersoonlijk gedrag van therapeut en patiënt werd door onafhankelijke beoordelaars gescoord op basis van beeldmateriaal van opgenomen behandelsessies. De hypothesen van de onderzoekers werden grotendeels bevestigd. Samengevat: het contact tussen patiënt en therapeut werd opener en gelijkwaardiger na de verschuiving van techniekgestuurde (CGT) naar interpersoonlijke supervisie en training, en die verandering kon methodologisch worden toegeschreven aan de switch als zodanig (in plaats van aan concurrerende, niet-inhoudelijke verklaringen, zoals de factor tijd). De (als zodanig heilzame) veranderingen in het interpersoonlijk gedrag van therapeut en patiënt (in de richting van meer flexibiliteit en meer wederkerigheid) na de switch naar AFT werden uitsluitend gemeten binnen de therapeutische context. Het is dus niet te zeggen of generalisatie naar de thuissituatie plaatsvindt, met andere woorden: of de behandeling daadwerkelijk aan effectiviteit wint door training in en supervisie over de therapeutische relatie.
De studie van Safran e.a. (2014) zou om die reden dus niet in aanmerking zijn gekomen voor een van de drie besproken meta-analyses. Het door Safran e.a. (2011a, 2011b) genoemde bezwaar dat patiënten met minder ‘uitdagende’ problematiek en persoonlijkheidsstijlen oververtegenwoordigd zijn in het effectonderzoek naar training en/of supervisie in het repareren van alliantiebarsten, gaat ook op voor de studie van Safran e.a. (2014): patiënten met cluster-C-persoonlijkheidsproblematiek kunnen natuurlijk interpersoonlijk ook een ‘uitdaging’ opleveren, maar alliantiemoeilijkheden zijn meer te verwachten bij patiënten in het cluster-B-spectrum (en wellicht ook het cluster-A-spectrum).
Naast de twee recente empirische studies van Kaplowitz e.a. (2011) en Safran e.a. (2014) is nog een derde, exploratieve en kwalitatieve, studie uit Nieuw-Zeeland vermeldenswaard. Cartwright en Read (2011) ontwikkelden een cursusmethode om a cursisten vertrouwd te maken met de concepten overdracht en tegenoverdracht, b aan de hand van deze concepten te leren reflecteren op het therapeutisch proces, en c tegenoverdrachtsreacties die cursisten bij zichzelf tegenkomen binnen de therapeutische relatie te leren hanteren ten gunste van de behandeling. De auteurs focusten op het leren onderscheiden van subjectieve (therapeutgebonden) en objectieve (patiëntgebonden) tegenoverdracht (voor een nadere bespreking zie Hafkenscheid, 2014, 2015). Zij gebruikten de egoposities uit de transactionele analyse (Berne, 1961) om cursisten onder meer vertrouwd te maken met hoe verschillende zelftoestanden (Ouder, Volwassene, Kind) bij de patiënt, alsmede veranderingen in die zelftoestanden, complementaire tegenoverdrachtsreacties (de patiënt toont bijvoorbeeld rebellerend kindgedrag en de therapeut reageert complementair met kritische oudergedrag) of concordante tegenoverdrachtsreacties (de therapeut reageert bijvoorbeeld met gekwetst kindgedrag op het gekwetst kindgedrag van de patiënt) bij de therapeut teweegbrengen.
De cursus omvatte twee dagen (met enkele tussenliggende weken) en werd gratis aangeboden aan gediplomeerde therapeuten, van wie er 28 deelnamen aan het onderzoek. De therapeuten vulden voor en na de cursus dezelfde lijst met open vragen in, waarvan de antwoorden door de onderzoekers volgens een codesysteem werden geanalyseerd. De antwoorden werden vergeleken op de veranderingen die tussen de voor- en nameting plaatsvonden. De lijst bestond deels uit kennisvragen en deels uit vragen naar therapeutreacties op klinische scenario’s (bijvoorbeeld de patiënt die drie keer achtereen te laat komt). Uit de kwalitatieve vergelijking van de antwoorden op de vragenlijst voor ten opzichte van na de cursus, concludeerden de onderzoekers dat de reflecties van de cursisten op de betekenis van overdracht en tegenoverdracht na de cursus rijker en genuanceerder waren geworden. Cursisten waren na de cursus minder geneigd om storende gevoelens over het therapeutisch contact exclusief aan eigen overgevoeligheden toe te schrijven, terwijl ze meer oog hadden gekregen voor het aandeel van de patiënt.
Een zwakke kant van de studie van Cartwright en Read (2011) is dat een controlegroep ontbrak. Een andere zwakte is dat de impact van de cursus louter kwalitatief werd bekeken. Een derde probleem is dat generalisatie van de effecten van de cursus naar het dagelijkse klinische werk van de cursus niet werd gemeten; een probleem dat door de auteurs ook zelf werd opgemerkt. Het is dus niet te zeggen of behandelingen daadwerkelijk effectiever werden na de cursus. Ook deze studie zou dus niet in aanmerking zijn gekomen voor opname in een van de drie besproken meta-analyses.
In meerdere opzichten dwingt het bestaande onderzoek naar de impact van training in en supervisie over het hanteren van de therapeutische relatie op het proces en de effectiviteit van psychotherapie tot bescheidenheid. In de eerste plaats is het aantal beschikbare studies op de vingers van twee handen te tellen: na aftrek van een ‘buitenbeentje’ (de onderzoekspublicatie van Safran e.a., 2005) blijven er acht studies (inclusief twee van de drie besproken oudere studies) over in de meta-analyse van Safran e.a. (2011a, 2011b). En dan zijn er de twee latere studies, die niet in deze meta-analyse konden worden meegenomen. Een van die twee recente studies (Cartwright & Read, 2011) was ook nog eens een open en kwalitatieve studie, en daarmee eigenlijk bij voorbaat al uitgesloten van meta-analyses. Alleen al getalsmatig rechtvaardigt het beschikbare effectonderzoek naar de impact van training in en supervisie over het hanteren van de therapeutische relatie dus geen stevige conclusies.
In de tweede plaats valt op dat vrijwel alle besproken kwantitatieve en toetsende studies zich kenmerken door wel erg kleine onderzoeksgroepen (5 ≤ n ≤ 22) van gesuperviseerde of getrainde (opleidings)therapeuten. Van elk van deze therapeuten werd (per onderzoeksfase) slechts een zeer bescheiden aantal patiënten (1 ≤ n ≤ 3) gevolgd. A priori is de kans om effecten te detecteren - aangenomen dat deze effecten er in de populatie zijn - daarmee relatief klein.
In de derde plaats helt de problematiek van patiënten die in het beschikbare onderzoek werden gevolgd nogal sterk over naar patiënten die niet per se de grootste samenwerkingsproblemen voor therapeuten opleveren, al werd in een enkele studie specifiek gefocust op patiënten met een slechte prognose (Vanderbilt-studie II) of patiënten bij wie de behandeling stagneert (Safran e.a., 2005; Safran, e.a., 2014). De waarde van training in en supervisie over het hanteren van de therapeutische relatie zou juist bij voorkeur moeten blijken bij deze laatste twee patiëntengroepen.
Ondanks deze methodologische beperkingen en inhoudelijke bezwaren vonden Safran e.a. (2005), Crits-Christoph e.a. (2006) en Bambling e.a. (2006) in afzonderlijke studies wel enige ondersteunende evidentie voor de toegevoegde waarde van training in en supervisie over de therapeutische relatie voor de uitkomst van behandeling. Ook de meta-analyse van Safran e.a. (2011a, 2011b), waarin de studies van Crits-Christoph e.a. (2006) en Bambling e.a. (2006) waren opgenomen, kwam tot die bevinding. De conclusie van Watkins (2011) ten aanzien van het gebrek aan vooruitgang in het onderzoek naar effectiviteit van supervisie in de brede zin, is voor het onderzoek dat zich specifiek richtte op de effectiviteit van training in en supervisie over de therapeutische relatie dus wellicht iets te pessimistisch.
In hun meta-analyse stellen Reiser en Milne (2014) standaardisatie als voorwaarde: de aard en inhoud van de geboden supervisie moet concreet en gedetailleerd zijn vastgelegd in een supervisieprotocol (vergelijkbaar met een behandelprotocol). Zonder een gestandaardiseerde aanpak van supervisie kan de onafhankelijke variabele namelijk niet eenduidig worden gedefinieerd.
Muran e.a.(2010) geven een inhoudelijke beschrijving van hun opleidingsprogramma in het Beth Israel Medical Centre, waarop een aantal van de in dit artikel besproken studies is gebaseerd. Uit de beschrijving blijkt dat hun opleidingsprogramma geenszins gestandaardiseerd is opgezet. Merkwaardig genoeg voeren zij hun befaamde (maar allerminst protocollaire) boek ‘Negotiating the therapeutic alliance: a relational treatment guide’ (Safran & Muran, 2000) zelf op als training manual. Feitelijk bestaat hun programma echter veeleer uit losse principes en uitgangspunten. Hun programma bepleit juist flexibiliteit en afstemming op de unieke configuratie van de therapeutische ontmoeting tussen een specifieke patiënt en een specifieke therapeut. Zonder twijfel voldoet hun opleidingsprogramma daarmee niet aan de door Reiser en Milne (2014) gestelde voorwaarde van standaardisatie.
Uit een recente kwalitatieve studie (Constantino e.a., 2013) bleek er onder experts overigens sowieso weinig overeenstemming te bestaan over de ideale opzet en inrichting van training in het hanteren van de therapeutische relatie. De voorwaarde van standaardisatie die Reiser en Milne (2014) stellen is bij methodische supervisie (supervisie over het juist toepassen van bepaalde therapeutische procedures en technieken) beter denkbaar en haalbaar dan bij persoonsgerichte supervisie, waarbij de supervisant leert hoe zijn idiosyncratische persoonskenmerken, overtuigingen en vooroordelen, levenservaringen en gedragsreflexen het therapeutisch proces positief en negatief beïnvloeden (Ladany e.a., 2005; Hafkenscheid, in druk; Veeninga & Hafkenscheid, 2010). Persoonsgerichte supervisie overlapt per definitie met supervisie over alliantiemoeilijkheden, waarmee de opleidingstherapeut zich geconfronteerd ziet in specifieke klinische situaties.
Los van haalbaarheid kan de wenselijkheid om training in en supervisie over het hanteren van de therapeutische relatie zo gestandaardiseerd mogelijk op te zetten en aan te bieden ter discussie worden gesteld. De ontgoochelende resultaten van de Vanderbilt-studie II mogen in dit opzicht als waarschuwing gelden: therapeuten die zich in een keurslijf voelen gedrongen, worden krampachtig en verliezen hun spontaniteit, wat juist averechts kan werken bij het repareren van alliantiemoeillijkheden of bij het hanteren van andere aspecten van de therapeutische relatie. De methodische zuiverheid (interne validiteit) die wordt bereikt door standaardisatie kan dus ten koste gaan van inhoudelijke betekenis (ecologische validiteit) van effectonderzoek naar training of supervisie.
In deze tijd van bezuinigingen en de nadruk op protocollair behandelen is het jammer genoeg niet erg waarschijnlijk dat er vanuit de universiteiten of behandelinstellingen de eerstkomende jaren geld beschikbaar zal zijn voor gedegen effectonderzoek naar de toegevoegde waarde van supervisie over en training in het hanteren van de therapeutische relatie. Juist in deze tijd zouden de postdoctorale instellingen voor opleidingen tot gezondheidszorgpsycholoog, psychotherapeut en klinisch psycholoog in dit opzicht, liefst in gezamenlijkheid, meer het voortouw mogen nemen dan nu het geval is.