Het artikel van Eurelings-Bontekoe, Snellen, Verschuur en Bosch in dit nummer riep uiteenlopende reacties op, zowel bij de externe beoordelaars als bij de redactie. Nu gebeurt het wel vaker dat de meningen verdeeld zijn over de vraag of een artikel publicabel is, niet alleen bij het Tijdschrift voor Psychotherapie: herhaaldelijk is gewezen op de willekeur en de onbetrouwbaarheid van het systeem van peer review (Jefferson, Alderson, Wager & Davidson, 2002). Maar de knoop moet toch worden doorgehakt. Dat in dit geval gekozen is voor publiceren heeft als belangrijke reden dat de door de auteurs beschreven werkwijze regelmatig in de klinische praktijk wordt toegepast, niet alleen als psychodiagnostische methode, maar ook in het kader van de indicatiestelling voor psychotherapie.
Hoewel in het artikel over de constructvalidering van de profielinterpretatie nauwelijks gerept wordt over indicatiestelling (in reactie op de kritiek van redactie en beoordelaars hebben de auteurs de passages hierover geschrapt), is dit wel een belangrijk oogmerk van de profielinterpretatie. In hun recentelijk verschenen boek over dynamische persoonlijkheidsdiagnostiek gaan Eurelings-Bontekoe en Snellen (2003) uitvoeriger in op indicatiestelling. Hun in de praktijk ontwikkelde methode kent naast grote voorstanders ook felle tegenstanders. De poging van de auteurs om hun methode empirisch te onderbouwen is dan ook zeer te waarderen. Dit is nog een reden om tot publicatie over te gaan. Maar het neemt niet weg dat er fundamentele bezwaren tegen de profielinterpretatie van de NVM en de constructvalidering ervan te formuleren zijn.
De discussie over een omstreden artikel kan op verschillende manieren gevoerd worden. De laatste keer dat voor een dergelijke discussie in dit Tijdschrift is gekozen, was in 1997 naar aanleiding van een artikel van Derksen over diagnostiek en indicatiestelling bij zogenaamde vroege stoornissen (Derksen, 1997a; Abraham, 1997a; Hummelen, 1997; Thiel, 1997; Derksen 1997b). Blijkbaar roepen artikelen over psychodynamische persoonlijkheidsdiagnostiek veel discussie op, zelfs als zij gevoerd wordt door louter psychotherapeuten van psychodynamische huize: Abraham, Hummelen en Thiel, die door de redactie als beoordelaars van Derksens artikel waren aangezocht, hadden allen een psychodynamische achtergrond. Deze keer is ervoor gekozen de reacties van beoordelaars en redactie niet afzonderlijk te publiceren, maar samen te voegen tot één commentaar. Hoewel ik voor honderd procent achter deze tekst sta en de formulering ervan geheel voor mijn rekening komt, hebben de externe beoordelaars van het artikel en de overige leden van de redactie substantieel bijgedragen tot het nu volgende commentaar.
In deze reactie zullen achtereenvolgens kanttekeningen worden geplaatst bij de theoretische uitgangspunten van de profielinterpretatie, de opzet en uitwerking van het valideringsonderzoek en de klinische implicaties van de beschreven methode.
Zoals gezegd, roept de psychodynamische persoonlijkheidsdiagnostiek veel discussie op. Dit heeft zeker te maken met de verschillende theoretische gezichtspunten binnen het psychodynamische referentiekader en de vraag hoe de psychodynamische persoonlijkheidsdiagnostiek zich verhoudt tot de psychiatrische persoonlijkheidsdiagnostiek volgens de as-II-persoonlijkheidsstoornissen van de DSM IV. Het spanningsveld tussen de structurele diagnostiek en de beschrijvende diagnostiek bleek ook al uit de reactie van Hummelen (1997) op Derksen (1997a). De conclusie van Hummelen loog er niet om: ‘De door Derksen gelegde verbanden tussen descriptieve stoornissen, stoornissen in bepaalde ontwikkelingsfasen en de indicatiestelling psychotherapie zijn theoretisch onvoldoende consistent’ (Hummelen, 1997, p. 188). Ook Eurelings-Bontekoe cum suis verwijzen regelmatig naar de relatie tussen structurele en beschrijvende diagnostiek, bijvoorbeeld waar zij refereren aan A-, B- en/of C-clusterkenmerken bij de structurele persoonlijkheidspathologie, samengevat in figuur 1 van hun artikel. Andere voorbeelden zijn de overeenkomst die zij zien tussen de ‘low level’ borderlinepathologie en de as-II-borderlinepersoonlijkheidsstoornis en de verwijzing naar Kernberg, die alle as-II-persoonlijkheidsstoornissen, met uitzondering van de obsessief-compulsieve persoonlijkheidsstoornis, plaatst in de categorie borderlinepersoonlijkheidsorganisatie. Deze passages zijn mogelijk verwarrend voor de lezer die deze verschillende beschrijvingsniveaus onvoldoende onderkent.
Ook door Vermote (2000) is een poging gedaan de relatie tussen structurele en beschrijvende persoonlijkheidsdiagnostiek te bespreken. Hij stuit hier echter op de eerder genoemde moeilijkheid: de overdaad aantheoretische gezichtspunten. Vermote begint zijn uiteenzetting over de psychoanalytische diagnostiek als volgt: ‘Tegenover de panoplie van ervaringen in het intakegesprek staat geen eenduidig psychoanalytisch model, maar een veelheid aan theoretische benaderingen. Analytici beroepen zich meestal op een al dan niet geëxpliciteerd referentiekader, samengesteld uit verschillende modellen. Deze tekst is daar een voorbeeld van’ (Vermote, 2000, p. 667). Deze karakteristieke beschrijving van het psychodynamische gedachtegoed geldt evenzeer voor de tekst van Eurelings-Bontekoe cum suis. Begripsverwarring en onduidelijkheid zijn in de uiteindelijke tekst weliswaar zo veel mogelijk uitgebannen, maar dit is zeker niet helemaal gelukt. Voor een belangrijk deel heeft dit te maken met het abstractieniveau en de hiermee gepaard gaande onduidelijkheid van de gehanteerde begrippen en modellen.
Zo baseren Eurelings-Bontekoe cum suis zich op het model van Kernberg, en hoewel het veelvuldig wordt geciteerd in de psychoanalytische literatuur is dit model nauwelijks empirisch onderbouwd. Elke persoon kan volgens Kernberg in principe geplaatst worden in één van de volgende categorieën: de neurotische, de borderline- of de psychotische persoonlijkheidsorganisatie. De structurele diagnostiek is erop gericht deze onbewuste dieptestructuur van de persoonlijkheid te beschrijven. Een belangrijk instrument hierbij is het structurele interview (Derksen, Hummelen & Bouwens, 1988). Het is opmerkelijk dat de afgelopen dertig jaar nauwelijks pogingen zijn ondernomen dit cruciale instrument op zijn merites te beoordelen. De enige gepubliceerde Nederlandse studie dateert uit 1989: Derksen, Hummelen en Bouwens (1989) onderzochten de interbeoordelaarbetrouwbaarheid van het structurele interview. Drie beoordelaars deelden 37 psychiatrische patiënten in in de drie persoonlijkheidsorganisaties. Hoewel de onderzoekers redelijk tevreden lijken over de gevonden resultaten – de betrouwbaarheid uitgedrukt in de zogenaamde kappa-waarden is matig tot substantieel – blijken de beoordelaars gemiddeld slechts in twee van de drie gevallen overeen te stemmen; een erg sensitief instrument is het dus zeker niet. De conclusies die de auteurs in hun artikel uit 1988 trokken, lijken dan ook nog steeds van kracht: de bruikbaarheid van de structurele diagnostiek is beperkt tot een eerste stap in het diagnostische proces; de bijdrage die het structurele gezichtspunt te bieden heeft aan de diagnostiek zal in de klinische praktijk nader uitgewerkt moeten worden; betrouwbaarheids- en validiteitsonderzoek zijn zeer relevant (Derksen, Hummelen & Bouwens, 1988).
Dit onderzoek moet nog steeds plaatsvinden. Ferdinand en De Nijs (2001) evalueerden enkele jaren geleden de informatie over persoonlijkheidsstoornissen op de website www.moeilijkemensen.nl. Wie deze website nu raadpleegt, kan constateren dat hun opmerking over het structureel interview er nog steeds te lezen valt en moet wel tot de conclusie komen dat zij nog steeds waar is: ‘Waarom wordt een concept dat niet betrouwbaar te meten is, toch naar voren gebracht als belangrijk?’ (p. 889). Als de betrouwbaarheid al te wensen over laat, hoe treurig moet het dan niet gesteld zijn met de validiteit?
Hetzelfde moet waarschijnlijk gezegd worden van het door Eurelings-Bontekoe cum suis zo relevant geachte begrip ‘angsttolerantie’. Zonder nadere toelichting of onderbouwing wordt het begrip geïntroduceerd (zie de tekst en figuur 1 in hun artikel). Het is geheel onduidelijk waarom angsttolerantie zo belangrijk is. Angsttolerantie is bij Kernberg slechts één van de ‘niet-specifieke manifestaties van ego-zwakheid’ van de borderlineorganisatie en geen structureel kenmerk van de persoonlijkheidsorganisatie.
Nog een laatste opmerking over de theoretische beschrijving van de structurele persoonlijkheidspathologie door Eurelings-Bontekoe cum suis. Is de veelvoud aan stoornissen in het borderlinedomein al onduidelijk, de beschrijving van de onrijpe persoonlijkheid is helemaal een monstrum. Niet alleen zou de onrijpe persoonlijkheid op descriptief niveau óf kenmerken van het B- en C-cluster óf kenmerken van het A- en C-cluster kunnen vertonen, maar ook zou in het eerste geval (B- en C-cluster) zowel sprake kunnen zijn van een kwetsbare als van een niet-kwetsbare variant. De diagnosticus die meent op betrouwbare en valide wijze een dergelijke diagnose te kunnen stellen, geeft blijk van moed.
De weg waarlangs Eurelings-Bontekoe cum suis komen tot een profielinterpretatie van de NVM kent een aantal onverantwoorde stappen, die hieronder zullen worden toegelicht. De eerste dubieuze stap betreft de herformulering van de betekenis van de NVM-dimensies Negativisme, Verlegenheid en Ernstige psychopathologie. De tweede stap is het gebruik van de ruwe scores op de NVM-dimensies. De derde stap is de volstrekt speculatieve interpretatie van combinaties van scores op de NVM-dimensies.
In de handleiding van de NVM (Luteijn & Kok, 1985) is de betekenis van de dimensies aangegeven. Zo wordt Ernstige psychopathologie als volgt beschreven: ‘Deze schaal bevat items die betrekking hebben op waanachtige gevoelens, paranoïde gedachten en bizarre belevingen. Hoogskoorders geven aan allerlei bizarre belevingen en/of wanen en/of paranoïde ideeën te hebben. Gemiddelde en lage skores dienen als “niet afwijkend” geïnterpreteerd te worden’ (p. 15; spelling onveranderd gelaten). Eurelings-Bontekoe cum suis veranderen de betekenis als volgt: ‘De Ernstige-psychopathologieschaal wordt geacht de Angsttolerantie te meten. Hoge scores op deze schaal wijzen op een verhoogde dispositie voor angst en achterdocht bij oplopende stress. Verhoogde scores weerspiegelen dan ook een instabiele affectregulatie: er is een neiging overmatig en inadequaat te reageren op stressrijke situaties, zodat men al snel door gevoelens wordt overspoeld en moeite heeft hoofd- en bijzaken te onderscheiden’ (p. xx).
Op vergelijkbare wijze worden Negativisme en Verlegenheid van een andere betekenis voorzien. Dit is uiteraard geheel onverantwoord. Een dergelijke herformulering zou op zichzelf al empirisch onderbouwd dienen te worden. Het idee dat deze herformulering is toegestaan, is vergelijkbaar met de opvatting dat een meetlat voor het meten van de lichaamslengte van bijvoorbeeld kinderen een goede maat is voor hun lichaamsgewicht. Er zal ongetwijfeld een significante positieve correlatie zijn tussen lengte en gewicht, maar dat maakt de centimeter nog geen betrouwbaar en valide instrument om het gewicht te bepalen. Nu begrijp ik wel dat Eurelings-Bontekoe geen goede ‘weegschaal’ voor angsttolerantie (en vele andere door hen gehanteerde begrippen) heeft, maar dat rechtvaardigt nog niet het maltraiteren van de NVM.
Het gebruik van de ruwe scores op de NVM-dimensies (zie figuur 2 in hun artikel) is eveneens onverantwoord. Deze ruwe scores zijn, zoals alle testscores, onderhevig aan meetfouten. Hiermee dient rekening gehouden te worden door waarschijnlijkheidsintervallen te schatten voordat scores geïnterpreteerd worden. Uiteraard zijn de auteurs met bovenstaande kritiekpunten geconfronteerd. Zij noemen deze dan ook in de discussie. Maar ze noemen, is uiteraard niet voldoende; zouden zij zich deze kritiek werkelijk aantrekken, dan zou hun gehele methode naar de prullenmand moeten worden verwezen, nog voor zij aan de derde dubieuze stap van hun werkwijze toekomen: een volstrekt speculatieve interpretatie van de combinatie van scores op de drie NVM-dimensies. Dit a priori interpretatiesysteem mag dan weliswaar op de klinische ervaring van de auteurs gebaseerd zijn, het leidt bij bepaalde combinaties wel tot erg gewaagde hypothesen. Zo zou de diagnosticus op descriptief niveau en rekening houdend met de betekenis die de schalen op dit niveau hebben, weinig pathologisch kunnen ontdekken bij personen met een lage score op Ernstige psychopathologie en Verlegenheid, maar volgens Eurelings-Bontekoe cum suis zouden we hier toch de hypothese ‘vroeg narcisme’ moeten formuleren.
De profielinterpretatie genereert volgens de auteurs hypothesen over de aanwezigheid van structurele, niet onmiddellijk in gedrag zichtbare kenmerken van psychopathologie en over latente, niet onmiddellijk zichtbare, en ook niet onmiddellijk voor het bewustzijn toegankelijke structurele persoonlijkheidskenmerken. Het lijkt per definitie moeilijk om hiervoor een extern validiteitscriterium te kiezen, niet alleen vanwege het onzichtbare en ontoegankelijke karakter van deze kenmerken, maar ook vanwege de diversiteit ervan. Impliciet aan de persoonlijkheidstypologie uit figuur 2 zijn immers allerlei opvattingen over op zichzelf ook al niet eenduidige concepten als ‘vermogen tot mentaliseren’ of ‘de structurele persoonlijkheidsorganisatie’. Het zou bijvoorbeeld mooi zijn als het structurele interview een goed instrument zou zijn om de persoonlijkheidsorganisatie volgens Kernberg vast te stellen, want dan zouden de voorspellingen op basis van de profielinterpretatie hieraan getoetst kunnen worden. Een ‘gouden’ standaard is echter niet voorhanden.
De keuze voor projectieve tests in dit verband, in het bijzonder de Thematische apperceptietest (TAT), zal veel lezers wellicht de wenkbrauwen doen fronsen. De TAT is in Nederland immers een omstreden test, die in de COTAN-beoordeling van 1992 een onvoldoende voor normen, betrouwbaarheid en validiteit kreeg (Evers, Van Vliet-Mulder & Ter Laak, 1992) en die in 2000 uit de ‘Documentatie van tests’ is verwijderd, omdat er na 1982 geen onderzoek in Nederland meer mee is verricht. Eurelings-Bontekoe cum suis verwijzen naar een scorings- en interpretatiesysteem voor de TAT van Westen dat zich richt op de rijpheid van cognitieve en affectieve representatieprocessen die het interpersoonlijk functioneren sturen. De discriminerende validiteit van het systeem is goed, zo wordt gesteld: patiënten met borderlinepathologie blijken met dit scoringssysteem te onderscheiden van normalen.
Mede gelet op de redelijke interbeoordelaarbetrouwbaarheid die Eurelings-Bontekoe cum suis in hun eigen onderzoek rapporteren voor de door hen gebruikte dimensie uit dit systeem (de ‘Complexiteit van de mentale representaties die men van het zelf en anderen heeft’) is de keuze van dit validiteitscriterium alleszins te verdedigen. Niettemin roept deze keuze een aantal vragen op. De gerapporteerde validiteit van het scoringssysteem zal wel betrekking hebben op het gehele systeem. Het is de vraag of bij gebruik van slechts één van de vier dimensies het onderscheid tussen de groepen ook nog valide te maken is. Bovendien ging het in de geciteerde literatuur over het onderscheid tussen borderline en normaal en niet over het onderscheid in de drie persoonlijkheidsorganisaties volgens Kernberg. Ook al is de gebruikte dimensie uit het scoringssysteem het meest verwant met het begrip ‘identiteitsintegratie/diffusie’ van Kernberg, gebruik van alle dimensies van het scoringssysteem zou meer voor de hand hebben gelegen, te meer daar er geen andere validiteitscriteria in deze studie zijn gebruikt.
De verschillen tussen de drie persoonlijkheidsorganisaties in de mate van Complexiteit zijn statistisch significant en in de voorspelde richting. Op basis van de profielinterpretatie kan dus min of meer voorspeld worden hoe de score is op Complexiteit. Maar is hiermee de profielinterpretatie van de NVM een valide methode om de persoonlijkheidsorganisatie volgens Kernberg vast te stellen? Om deze vraag te beantwoorden moet onder andere duidelijk worden hoe goed de score op Complexiteit te voorspellen valt op basis van de profielinterpretatie. Eurelings-Bontekoe cum suis trekken wel heel snel de conclusie dat de profielinterpretatie superieur is aan de interpretatie van de afzonderlijke schalen van de NVM. Zij vinden een significante correlatie tussen Ernstige psychopathologie en Complexiteit. Theoretisch gezien is deze correlatie goed te interpreteren als we Ernstige psychopathologie opvatten als een operationalisatie van realiteitstoetsing, een ander door Kernberg relevant geacht structureel kenmerk van de persoonlijkheidsorganisatie. Mijn voorspelling zou zijn dat op basis van de score op Ernstige psychopathologie een onderscheid tussen de psychotische persoonlijkheidsorganisatie en de beide andere persoonlijkheidsorganisaties te maken is. Probleem in deze discussie blijft natuurlijk dat er geen goed validiteitscriterium voor de indeling in persoonlijkheidsorganisatie voorhanden is, zodat ook niet vast te stellen is of de profielinterpretatie superieur is aan een voorspelling op basis van de afzonderlijke dimensies.
Bij de vraag hoe goed op basis van de profielinterpretatie de Complexiteit te voorspellen valt, is van belang of statistische verschillen ook klinisch relevante verschillen zijn. De gemiddelde scores van de drie persoonlijkheidsorganisaties liggen dicht bij elkaar (zie tabel 1 in hun artikel), tussen 1,5 en 2,5 bij een theoretische range van 1 tot 5. Gelet op de betekenis die aan de verschillende schaalwaarden wordt gegeven, is mijn indruk dat zeker voor de neurotische persoonlijkheidsorganisatie de score erg laag is. Maar ik neem aan dat er geen normgegevens voor deze score zijn, dus die indruk is moeilijk te toetsen. Hier staat tegenover dat de spreiding van de scores voor de drie groepen (zie de standaarddeviaties in tabel 1) opvallend gering is. Hierdoor zullen de verschillen sneller significant zijn dan bij een grotere spreiding. Bovendien is de overlap in scores van de drie groepen geringer, wat gunstig is voor de sensitiviteit en de specificiteit.
Deze laatste twee begrippen zijn belangrijk bij het bepalen van de klinische waarde van een test, in dit geval de profielinterpretatie. De sensitiviteit en specificiteit van een test betreffen hier de kans dat de op basis van de profielinterpretatie vastgestelde persoonlijkheidsorganisatie ook de ‘echte’ persoonlijkheidsorganisatie is. Om deze maten te bepalen is echter weer een duidelijk validiteitscriterium nodig. Hoe vaak de indeling bij de profielinterpretatie juist of onjuist uitpakt, is door het ontbreken van een gouden standaard niet te zeggen.
Dit roept de vraag op in hoeverre het verantwoord is de profielinterpretatie toe te passen in de klinische praktijk. We kunnen stellen dat het, strikt genomen, onverantwoord is. Een tegenwerping hier zou kunnen zijn dat de auteurs de profielinterpretatie slechts beschouwen als hypothesegenererend. Zolang echter onduidelijk is hoe deze hypothesen vervolgens worden getoetst, kunnen klinische uitspraken, bijvoorbeeld over de persoonlijkheidspathologie of over de in te stellen behandeling, beter achterwege blijven. Let wel: we hebben tot nu toe slechts gesproken over de voorspellende waarde van de profielinterpretatie voor een driedeling in de persoonlijkheidsorganisatie. De pretentie van de profielinterpretatie gaat echter veel verder, namelijk binnen de borderlineorganisatie een verdere differentiatie aanbrengen. Deze laatste pretentie kan al helemaal niet worden waargemaakt.
Over de waarde van de profielinterpretatie voor de indicatiestelling voor psychotherapie wil ik hier kort zijn, omdat daar in de uiteindelijke versie van het artikel weinig over wordt gezegd. De auteurs geven echter in hun inleiding wel te kennen dat op basis van de profielinterpretatie voorlopige richtlijnen voor het psychotherapeutische handelen kunnen worden afgeleid. Ik verwees al eerder naar het boek van Eurelings-Bontekoe en Snellen (2003), waarin zij nader ingaan op deze indicatiestelling. Zij verwijzen in dit verband naar het ontwikkelingsprofiel van Abraham (1997b). Op basis van het voorafgaande zal duidelijk zijn dat ik de opinie van de auteurs over het nut van de profielinterpretatie niet onderschrijf. Hun aanzet tot constructvalidering van de profielinterpretatie van de NVM is onvoldoende basis om hieraan richtlijnen voor de psychotherapeutische behandeling te ontlenen.
Bovenstaande kritiek zal door de auteurs niet gedeeld worden en zal ook geen eind maken aan hun pogingen de profielinterpretatie in de klinische praktijk in Nederland verder ingang te doen vinden. Even leek het erop dat het om een praktische reden afgelopen zou zijn met deze werkwijze. Barelds, Luteijn, Zwanepol en Mullenders (2004) lieten weten dat de uitgever van de MMPI in de Verenigde Staten (University of Minnesota Press) het standpunt had ingenomen dat verkortingen van de MMPI niet mogen worden uitgegeven. De verkoop van de NVM is dan ook met ingang van 2004 gestaakt. Ter vervanging van deze veelgebruikte test is door Luteijn en Barelds een nieuwe test geconstrueerd: de Negativisme-, ernstige psychopathologie- en somatiseringtest (NPST: Luteijn & Barelds, 2004). Het ontbreken van de dimensie Verlegenheid in deze nieuwe test maakt dat deze test wellicht niet een zelfde lot beschoren is als de NVM. Het is immers wel ironisch dat een test die destijds ontwikkeld is uit onvrede met de Nederlandse versie van de MMPI, welke laatste in 1992 nog een onvoldoende COTAN-beoordeling kreeg op normen, betrouwbaarheid en validiteit, en die niettemin in de praktijk veelvuldig met behulp van profielinterpretaties werd toegepast, vervolgens opnieuw geïnterpreteerd wordt op basis van het profiel in plaats van de afzonderlijke dimensies.
Het genoemde praktische probleem lijkt inmiddels opgelost door Derksen, Vendrig, Egger, De Mey en Saschowa (2004). Zij beschrijven hoe zij uit de MMPI-2 een NVM-2-versie hebben samengesteld en vergelijken deze met de NVM. Hun conclusie is dat de NVM-2 hetzelfde meet als de NVM en dat deze op valide wijze gescoord kan worden uit de MMPI-2. Volgens de auteurs zou men met dit gebruik ook niet meer in strijd handelen met de voorschriften van de University of Minnesota Press. Nu maar hopen dat de klinische gebruikers van de NVM-2 deze vooral in termen van de afzonderlijke dimensies zullen interpreteren en dat zij een profielinterpretatie achterwege zullen laten.
Literatuur
Construct validation of the profile interpretation of the Dutch Short Form of the MMPI: foundation or quicksand?