De profielinterpretatie van de NVM door Eurelings en Snellen: onvoldoende empirische onderbouwing voor klinische toepassing

Tijdschrift voor Psychotherapie
© Bohn Stafleu van Loghum 2005
10.1007/BF03062146

Forum

De profielinterpretatie van de NVM door Eurelings en Snellen: onvoldoende empirische onderbouwing voor klinische toepassing

W. J. SmidContact Information J. H. Kamphuis

(1) 

Contact Information W. J. Smid
Email: wsmid@hoevenstichting.nl

Samenvatting  
In februari van dit jaar publiceerden wij in de Psycholoog (Smid & Kamphuis, 2005) een kritisch artikel over de dynamische theoriegestuurde profielinterpretatie (hierna: de DTP) van Eurelings-Bontekoe en Snellen, naar aanleiding van hun recente boek ’Dynamische persoonlijkheidsdiagnostiek‘ (Eurelings-Bontekoe & Snellen, 2003). De afwezigheid van gepubliceerd empirisch onderzoek naar de DTP-methode was een belangrijk kritiekpunt. Het onlangs gepubliceerde onderzoek in het Tijdschrift voor Psychotherapie (Eurelings-Bontekoe, Snellen, Verschuur & Bosch, 2005) hebben wij dan ook met veel interesse gelezen. Een goed deel van het commentaar van Jaspers (2005) op dit onderzoek en op de profielinterpretatie in het algemeen onderschrijven wij, maar onze invalshoek is wezenlijk anders.
drs. wineke smid, onderzoekspsycholoog, is werkzaam in de Dr. Henri van der Hoevenkliniek.
dr. jan-henk kamphuis is universitair hoofddocent bij de programmagroep klinische psychologie van de Universiteit van Amsterdam.

Inleiding

In februari van dit jaar publiceerden wij in de Psycholoog (Smid & Kamphuis, 2005) een kritisch artikel over de dynamische theoriegestuurde profielinterpretatie (hierna: de DTP) van Eurelings-Bontekoe en Snellen, naar aanleiding van hun recente boek ’Dynamische persoonlijkheidsdiagnostiek‘ (Eurelings-Bontekoe & Snellen, 2003). De afwezigheid van gepubliceerd empirisch onderzoek naar de DTP-methode was een belangrijk kritiekpunt. Het onlangs gepubliceerde onderzoek in het Tijdschrift voor Psychotherapie (Eurelings-Bontekoe, Snellen, Verschuur & Bosch, 2005) hebben wij dan ook met veel interesse gelezen. Een goed deel van het commentaar van Jaspers (2005) op dit onderzoek en op de profielinterpretatie in het algemeen onderschrijven wij, maar onze invalshoek is wezenlijk anders. Vandaar dat wij graag ingaan op de uitnodiging om ons te mengen in de ontstane discussie en controverse.

Bij een kritische evaluatie van de DTP moet onderscheid gemaakt worden tussen:
a. 
de ambitie van de methodiek;
b. 
de theoretische uitgangspunten;
c. 
de operationalisatie van het systeem en de empirische onderbouwing ervan;
d. 
de klinische toepassing van het systeem.

Als schot voor de boeg willen we stellen dat de voornaamste problemen van de DTP wat ons betreft punt c en a fortiori punt d betreffen. De ambitie van Eurelings en Snellen om te komen tot een structurele diagnostiek die testresultaten integreert en die meer wil dan enkel beschrijven, lijkt ons sympathiek en sluit klaarblijkelijk nauw aan bij de behoefte van veel clinici. De theoretische uitgangspunten van de DTP zijn niet principieel het probleem. Verstandige mensen kunnen van mening verschillen of juist Kernbergs theorie (Kernberg, 1984) de grootste belofte biedt – en dat doen verstandige mensen dan ook. Ons commentaar is vooral gericht op de weinig consistente uitwerking van de DTP en het gebrek aan empirische onderbouwing. Klinische toepassing is dan ook vooralsnog prematuur en professioneel onverantwoord.

Het paard achter de wagen spannend, lijken Eurelings en Snellen (2005) juist aan het wijdverbreide gebruik van de profielinterpretatie steun te ontlenen voor de validiteit ervan. Zij stellen: ’Deze door ons ontwikkelde methode van profielinterpretatie (...) wordt op grote schaal in de Nederlandse GGZ toegepast‘ en zij trekken vervolgens de conclusie: ’Deze methode heeft duidelijk grote klinische waarde‘ (p. 59). Dezelfde redenering wordt aangewend ter ondersteuning van de theorie van Kernberg: ’Dit model wordt al jaren op grote schaal in de klinische praktijk toegepast en heeft daarmee zijn klinische waarde en bruikbaarheid bewezen‘ (p. 62). Deze ’klinische waarde‘, verderop zelfs ’klinische validiteit‘ genoemd, is naar onze mening een vaag en betekenisloos begrip. Aderlaten was destijds ook een alom gebezigde en geprezen methode met grote ’klinische waarde‘. Ook andere methoden en theorieën uit het verleden hebben meer dan eens duidelijk gemaakt dat een wijdverbreid gebruik niets zegt over de betrouwbaarheid en validiteit van een methode.

Ons artikel in de Psycholoog (Smid & Kamphuis, 2005) was gericht op de DTP als geheel, zoals die is beschreven in Eurelings-Bontekoe en Snellen (2003). De meeste van onze bezwaren tegen de DTP als geheel gelden onverminderd voor de specifieke profielinterpretatie van de NVM. We zullen achtereenvolgens aan de orde stellen:
1. 
de onduidelijkheid over de precieze inhoud van de profielinterpretatie;
2. 
het oneigenlijke gebruik van testschalen (de zogenaamde conceptual drift);
3. 
de veronachtzaming van de beperkte betrouwbaarheid van de testscores;
4. 
de pathologiserende interpretaties;
5. 
het (nog steeds) overweldigende gebrek aan empirische fundering, waarbij we uiteraard stil zullen staan bij de zeggingskracht van het recent verschenen empirische onderzoek van Eurelings-Bontekoe en Snellen (2005).

Onduidelijke inhoud

Een vraag die bij ons opkwam, is of het door Eurelings en anderen (2005) gepresenteerde empirisch onderzoek samenvalt met de in het boek (Eurelings-Bontekoe & Snellen, 2003) genoemde ’eerste (internationale) publicatie‘ met ’veelbelovende‘ resultaten (ten tijde van de verschijning van het boek reeds onder review). Als dat zo is, rijst vervolgens de vraag waarom er zo veel opmerkelijke verschillen zijn tussen de in het boek beschreven werkwijze met betrekking tot de NVM en de werkwijze die uit het genoemde artikel naar voren komt. Bijvoorbeeld: de impulsief/afhankelijke borderline-, de zwak neurotische, latent psychotische, en overdekt vroeg-narcistische persoonlijkheidsorganisaties uit het boek zijn in het artikel niet meer terug te vinden. Voor de high level borderlineorganisatie is de Negativismescore nu blijkbaar niet meer van belang (in tegenstelling tot in het boek); hetzelfde geldt voor de Somatisatiescore bij de psychotische borderlineorganisatie. Bovendien is de grenswaarde voor de psychotische borderlineorganisatie op Negativisme verschoven van =28 naar =32. Uiteindelijk leiden in het boek dertien scorecombinaties tot dertien verschillend genaamde varianten in persoonlijkheidsorganisatie; in het artikel leiden elf verschillende scorecombinaties tot maar acht verschillend genaamde variaties in persoonlijkheidsorganisatie. Is de indeling sinds het uitkomen van het boek bewust gewijzigd en zo ja, waarom? Zijn er nu acht of elf variaties in de persoonlijkheidsorganisatie? Zijn de neurotisch georganiseerden met een Verlegenheidsscore van =20 nu wezenlijk anders dan die met een Verlegenheidsscore van =26 en zo ja, waarom hebben ze dan geen aparte benaming (meer)? Hoe het ook zij, de revisies zijn niet gebaseerd op gepubliceerd empirisch onderzoek.

De inconsistenties geven aan dat er bij de profielinterpretatie van de NVM – net als bij de DTP in het algemeen – nog niet kan worden gesproken van een heldere, solide uitwerking. Dat is wel noodzakelijk om bijvoorbeeld de interbeoordelaarbetrouwbaarheid te kunnen garanderen. Zoals Eurelings en Snellen zelf in hun boek opmerken, is een heldere omschrijving ’een eerste en noodzakelijke stap‘ op de weg naar empirische fundering.


Conceptual drift

Uit onderzoek blijkt dat de NVM een behoorlijk valide instrument is (zie COTAN; Evers, Van Vliet-Mulder & Groot, 2000). Maar deze validiteit is niet van toepassing op de resultaten van de profielinterpretatie, omdat verschillende NVM-schalen in de DTP een volstrekt andere betekenis krijgen. Eurelings en Snellen (2005) schrijven in hun dupliek op Jaspers dat de betekenis van de schalen slechts is ’verruimd‘ op basis van gezond verstand. Het woord ’verruimd‘ lijkt een eufemisme wanneer we zien dat er betekenissen ontstaan die werkelijk haaks staan op die uit de originele handleiding. Daarbij is de stellig geponeerde logica van Eurelings en Snellen aanstekelijk, maar zeker niet onweerlegbaar. Nemen we bijvoorbeeld de door Eurelings en Snellen in hun artikel genoemde ’verruiming‘ van de betekenis van de Verlegenheidsschaal van de NVM. In de handleiding (Luteijn & Kok, 1985) staat geschreven: ’De items van deze schaal weerspiegelen voornamelijk een gevoel van verlegenheid en moeite in het contact met anderen. Deze schaal is te beschouwen als een paralleltest van SI-schaal (Sociale-inadequatieschaal) van de NPV (Nederlandse persoonlijkheidsvragenlijst). Hoogscoorders geven aan zich vaak erg verlegen te voelen en dit als een probleem te ervaren. Ze zijn terughoudend, introvert, zwijgzaam, op zichzelf en weinig sociabel‘ (p. 15). Eurelings en Snellen argumenteren dat iedereen weet dat ’Verlegenheid ervaren impliceert dat je je bewust bent van de aanwezigheid van een ander, die nadenkt over jou en een visie op je heeft, en dat je in staat bent rekening te houden met de ander‘ (p. 60). Zo komen ze tot de ’verruimde‘ betekenis van Verlegenheid als zijnde ’Controle, remming en het vermogen tot afstemming op de omgeving‘. In hun boek formuleren ze het uitgebreider: ’Als zodanig geformuleerd staat een voldoende mate van Verlegenheid voor het beschikken over zowel adequate egofuncties, als differentiërend en kritisch vermogen, metacognitieve controle, impulscontrole en frustratietolerantie alsook over adequate superegofuncties, als het zich kunnen houden aan gangbare normen en waarden en zich langdurig kunnen inzetten voor en committeren aan zelfgekozen doelen en idealen, waarbij tevens rekening wordt gehouden met de belangen van anderen‘ (Eurelings-Bontekoe en Snellen, 2003, p. 78). Verlegenheid krijgt zo een buitengewoon positieve betekenis en wordt een maat voor een soort sociale adequatie.

De auteurs laten onvermeld dat de correlatie tussen de Verlegenheidsschaal van de NVM en de Sociale-inadequatieschaal van de NPV, die binnen de DTP eveneens een rol speelt, maar liefst 0,75 is. Gezien het feit dat de correlatie tussen de schalen niet groter kan worden dan hun betrouwbaarheid (0,83) is deze correlatie bijna maximaal (Luteijn & Barelds, 2003). Deze twee schalen meten dus sterk overeenkomstige eigenschappen en in de handleiding van de NVM wordt de Verlegenheidsschaal dan ook nadrukkelijk genoemd als een paralleltest van de Sociale-inadequatieschaal (Luteijn & Kok, 1985). Binnen de DTP behoudt de Sociale-inadequatieschaal van de NPV zijn oorspronkelijke betekenis, maar de Verlegenheidsschaal van de NVM krijgt een vrijwel tegengestelde betekenis. Dit is geen ’verruiming‘, maar een betekenisverandering van 180 graden: van Verlegenheid/sociale inadequatie naar een soort sociale adequatie. Dit is dus zeker een voorbeeld van wat Jaspers (2005, p. 54) ’het maltraiteren van de NVM‘ noemt.


Veronachtzaming van onbetrouwbaarheid

Bij de profielinterpretatie van de NVM wordt grote betekenis gegeven aan zeer kleine scoreverschillen. Zo schrijven Eurelings en Snellen in hun boek (2003): ’Van tekortschietende controle en dus van low level borderlinepathologie is sprake wanneer de Verlegenheid-score (…) =13. Van zwakke controle en dus van psychotische organisatie is sprake wanneer de Verlegenheid-score (…) =14‘ (p. 139). Een verschil van 1 punt op de Verlegenheidsschaal (meetfout 2,75) maakt hier dus het verschil tussen een borderline- en een psychotische organisatie. Maar de kans dat bij een gevonden score van 14 de werkelijke score op deze schaal 13 of lager is, bedraagt 36%. De diagnose bij een dergelijke grensscore valt in drie tot vier van de tien gevallen dus verkeerd uit. Zelfs als de persoonlijkheidsorganisatiediagnoses conceptueel valide zouden zijn, zijn ze statistisch te onzeker om bruikbaar te zijn.

In hun dupliek verdedigen Eurelings en Snellen (2005) hun werkwijze door erop te wijzen dat de profielinterpretatie slechts ’hypothesen‘ genereert en dat die hypothesen nog nader getoetst moeten worden. De manier waarop dat toetsen zou moeten gebeuren, blijft echter in nevelen gehuld. Dit is een veel te vrijblijvende opstelling, waarmee Eurelings en Snellen het probleem doorschuiven naar de individuele diagnosticus, terwijl het verantwoorder zou zijn om zo veel mogelijk betrouwbaarheid en validiteit in de methode zelf in te bouwen. Dat kan bijvoorbeeld door marges aan te houden tussen de scores die verwijzen naar de verschillende persoonlijkheidsorganisaties. De door Eurelings en Snellen beoogde transparantie van de methode wordt daar zeker niet door geschaad en de betrouwbaarheid van de resultaten neemt toe.

De suggestie die Eurelings en Snellen in hun boek (2003) doen, is de DTP-hypothesen te toetsen ’met behulp van andere informatie, zoals informatie afkomstig uit andere tests, (hetero) anamnese en klinische observaties‘ (blz. 12). Binnen de bredere DTP-methode wordt echter geen enkel instrument ter toetsing gebruikt; alle scores op alle instrumenten leiden tot nieuwe conclusies c.q. hypothesen en niet tot aanpassing van eerdere hypothesen. Als de schaalscores op de verschillende tests met elkaar in overeenstemming zijn, is dat ondersteuning voor de hypothese. Als de schaalscores op verschillende tests elkaar tegenspreken, is dat bewijs voor weer een andere hypothese (ontkenning of verdringing bijvoorbeeld). Wat overblijft, is bevestiging zoeken in anamnese of observaties. Maar dat is nauwelijks nog toetsen te noemen en bovendien zijn de op de NVM gebaseerde voorspellingen veelal reeds in de vorm niet falsifieerbaar. Als patiënten bijvoorbeeld in de praktijk wel goed functioneren bij een problematische NVM-score zou dit volgens Eurelings en Snellen nog wel eens heel erg mis kunnen gaan, maar dat hoeft weer niet per se. Evenmin zijn patiënten zich noodzakelijk bewust van het feit dat er iets mis is. Dit alles maakt de hypothesen op basis van de profielinterpretatie wel erg vrijblijvend en slecht falsifieerbaar.


Pathologiserende interpretaties

Net als Jaspers (2005) constateerden wij (Smid & Kamphuis, 2005) dat het onmogelijk is om psychisch ’gezond‘ uit de profielinterpretatie naar voren te komen – niet een erg aantrekkelijk vooruitzicht voor de patiënt, zo lijkt het. Eurelings en Snellen (2005) verdedigen zich met de stelling dat de profielinterpretatie alleen toegepast mag worden wanneer er ’reden voor klinisch-psychodiagnostisch onderzoek is‘; in hun boek (2003) noemen ze dat: reason for encounter. Wanneer deze reden er is, mogen ook lage en zelfs gemiddelde scores als problematisch geïnterpreteerd worden, want men weet dan immers al dat er wat ’mis‘ is met de patiënt. Het lijkt echter voorbarig om te denken dat bij elke hulpzoekende patiënt ook altijd (mede) sprake is van persoonlijkheidspathologie. Toch is het zo dat elke patiënt met reason for encounter die door middel van de profielinterpretatie gediagnosticeerd wordt persoonlijkheidspathologie toegeschreven krijgt, ook als die patiënt in werkelijkheid bijvoorbeeld alleen een paniekstoornis of hoogtevrees zou hebben, of bijvoorbeeld een ongelukkig huwelijk waarvoor relatietherapie gezocht wordt. Bovendien impliceert deze denktrant dat de profielinterpretatie bij ’zieken‘ iets fundamenteel anders meet dan bij ’gezonde‘ mensen en dat is een opvallend uitgangspunt, dat op z'n minst enige toelichting en empirische onderbouwing verdient.


Ontbreken van empirische onderbouwing

Met nadruk stellen Eurelings en Snellen (2005) zelf vast dat het gepubliceerde onderzoek slechts de eerste stap is in het proces van validering. Enige verontschuldiging zou hier op zijn plaats zijn omdat het inderdaad pas het allereerste onderzoek is naar een methode die reeds begin jaren '90 van de vorige eeuw gelanceerd werd (Snellen, 1990; Jonker & Snellen, 1991; Snellen, 1993). Maar in plaats van zich te verontschuldigen gebruiken zij in hun dupliek het feit dat er pas één onderzoek is gedaan om de kritiek van Jaspers (2005) af te doen als prematuur. Dat lijkt ons toch echt de omgekeerde wereld: prematuur is het om jarenlang een methode te gebruiken, te doceren en overal uit te dragen waaraan nog niets onderzocht is!

Zeker wanneer men zich realiseert hoe breed de profielinterpretatie in Nederland wordt toegepast, is het onthutsend dat de gepresenteerde studie de eerste preliminaire poging tot validering is. We mogen aannemen dat de DTP ondertussen niet als vrijblijvende spielerei wordt ingezet – dat zou immers heel onethisch zijn – maar om klinische beslissingen te ondersteunen, die voor individuele personen van groot belang kunnen zijn. Te denken valt aan de formulering/aanpassing van het behandelplan, maar ook, gelet op toepassing in de forensische sector, aan beslissingen rondom verlof. En dit alles zonder empirisch fundament! Dat kunnen psychologen, bij uitstek een beroepsgroep die stilstaat bij de kwaliteit van kennis, toch niet voor hun rekening nemen? Theorie zonder empirie kan zeer schadelijk zijn; het klinisch gebruik is niet iets om de schouders bij op te halen. Jaspers heeft dan ook volledig gelijk wanneer hij stelt dat klinische toepassing in strikte zin onverantwoord is. Het lijkt ons geen sinecure de klinische toepassing van de NVM-profielinterpretatie tegenover kritische, goed geïnformeerde vakgenoten (of advocaten!) te verdedigen.

De rechtvaardiging die Eurelings en Snellen geven voor het ontbrekende onderzoek is niet overtuigend: de materie is complex en moeilijk toegankelijk en dus moeilijk te onderzoeken. Daarbij beroepen ze zich op Shedler en Westen (2004), die stellen dat een 100% betrouwbaar en valide instrument met een 100% klinische bruikbaarheid een utopie is. Dit onderschrijven wij graag, maar Eurelings en Snellen lijken deze stellingname aan te grijpen om zichzelf te ontslaan van elke bekommering om validiteit en betrouwbaarheid: het ideaal is onhaalbaar, dus doen we maar niets. Maar het is wetenschappelijk wel een eerste vereiste dat er onderzoek gedaan wordt naar de betrouwbaarheid en validiteit van de profielinterpretatie alvorens deze op grote schaal gebruikt kan worden. Uit dat onderzoek zal dan moeten blijken of de validiteit en betrouwbaarheid tenminste op een aanvaardbaar niveau liggen, waarbij 100% perfectie natuurlijk nooit de norm kan zijn. De gebruiker moet weten waar de marges liggen en hoe groot ze zijn, opdat op verantwoorde wijze kan worden omgegaan met de beperkingen van de methode.


Het empirisch onderzoek

Enerzijds benadrukken Eurelings en Snellen (2005) dus dat hun gepubliceerde onderzoek (Eurelings-Bontekoe en anderen, 2005) nog maar het prille begin is, anderzijds suggereren ze verderop in hun dupliek dat dit ene onderzoek aan zou tonen dat de gehele methode niet ’op drijfzand berust‘, omdat de resultaten ’sterk en niet te loochenen‘ zijn. Dat lijkt ons wat voorbarig, want het onderzoek laat een groot aantal vragen onbeantwoord.

Jaspers (2005) stelt terecht dat (een dimensie van de SCORS van) de TAT niet bekend staat als een bruikbaar (’gouden standaard‘) criterium; het is een maat die zelf nog veel empirische onderbouwing nodig heeft voordat hij als criterium voor andere instrumenten kan dienen. Constructvaliditeit komt immers tot stand door een construct in relatie te brengen met gevalideerde constructen uit het nomologische netwerk, waarbij zowel discriminante als convergente relaties worden getoetst, liefst aan maten die reeds ’staan als een huis‘, zogenaamde ’gouden standaards‘. Het gepresenteerde onderzoek schiet tekort ten opzichte van een dergelijk model. Maar: algehele afwijzing van de onderzoeksresultaten op grond van de twijfelachtige reputatie van de TAT of de schaal van Westens (1991) SCORS-systeem gaat ons te ver. Deze instrumenten zijn nu eenmaal gemaakt om vergelijkbare constructen te meten als die waar Eurelings en Snellen mee werken. Toch stelt zich de vraag: waarom gebruiken Eurelings cum suis Kernbergs interview niet ter validering van de NVM als diagnostisch instrument voor de vaststelling van persoonlijkheidsorganisatie? Ze baseren zich op zijn theorie, ze meten zijn concepten; waarom dan een ingewikkelde afleiding van een deelmaat maken uit weer een ander omstreden instrument terwijl the real thing gewoon voorhanden is?

Wij wijzen de onderzoeksresultaten dus niet bij voorbaat af, maar de crux zit hem natuurlijk in de uit dit onderzoek te trekken conclusies. De conclusie die de auteurs trekken, is dat er een duidelijke samenhang blijkt tussen de drie niveaus van persoonlijkheidsorganisatie zoals gemeten door de NVM en ’de complexiteit van de mentale representaties die men van het zelf en anderen heeft‘, zoals gemeten door de TAT. Hierbij beroepen zij zich op grote effect sizes. De overtuigendste resultaten – zie Tabel 1 waarin de NVM-profielinterpretatie-indeling wordt gekruist met een SCORS-dimensie van de TAT – kunnen echter ook veel spaarzamer verklaard worden dan de auteurs doen. Mogelijk kan alleen de Ernstige-psychopathologie-schaal dit verband al verklaren, maar dit valt helaas niet uit de gepresenteerde analyses af te leiden. Enigszins misleidend doen de auteurs de enkelvoudige correlatie tussen de NVM-Ernstige-psychopathologiescore en de SCORS-Complexiteitsscore af als een ’zwak negatief verband‘ – en dat is misleidend want de gangbare interpretatie van een correlatie (met een absolute waarde) van ongeveer 0,30 is die van een medium (middelmatig, gemiddeld) sterk verband.

Een tweede punt is dat de hypothesen wel wat gemakzuchtig geformuleerd zijn: hoe hoger het niveau van persoonlijkheidsorganisatie, des te hoger de verwachte complexiteit. Aan de hand van de theorie had die hypothese wel wat scherper gekund. Op basis van de theorie is tamelijk precies te voorspellen op welk niveau van complexiteit de verschillende persoonlijkheidsorganisaties zouden moeten scoren. Bijvoorbeeld: ’De psychotische organisatie kenmerkt zich door identiteitsdiffusie en lacunaire gewetensfuncties. Innerlijke zelf- en objectrepresentaties zijn ofwel goedaardig symbiotisch ofwel destructief en dus zeer beangstigend; de grenzen tussen het zelf en de ander zijn afwezig‘ (Eurelings-Bontekoe en anderen, 2005, p. 32). Mensen met een psychotische organisatie zouden aldus uit moeten komen op niveau 1: ’Op niveau 1 worden mensen slecht van elkaar onderscheiden of de onderzochte maakt geen onderscheid tussen eigen gedachten en gevoelens en die van de persoon op de plaat‘ (p. 42). Anderzijds wordt ’de neurotische organisatie gekenmerkt door identiteitsintegratie. Innerlijke zelf- en objectrepresentaties zijn dan ook goed van elkaar onderscheiden en ambivalent‘ (p. 31). Mensen met een neurotische organisatie horen dus thuis op complexiteitsniveau 4 of 5: ’Op niveau 4 blijkt er enig zicht op de complexiteit van iemands karakter en innerlijke belevingswereld. Op niveau 5 ziet men de persoon in zijn volle complexiteit, met al zijn conflicten en ambivalenties en bewuste en onbewuste mentale processen‘ (p. 43). De onderzoeksresultaten tonen voor de drie persoonlijkheidorganisaties gemiddelde scores op ’Complexiteit van mentale representaties‘ tussen de 1,54 en 2,51. Hoe is het binnen de theorie van Eurelings cum suis mogelijk dat mensen met een neurotische persoonlijkheidsorganisatie, dus met een Verlegenheidsscore van minstens 20 met alle veronderstellingen die daarbij horen, toch gemiddeld uitkomen op het niveau van de eendimensionale, globale zwart-witbeschrijving of slechts heel oppervlakkige ideeën over gedachten en karakter van de ander? In dit licht beschouwd vinden wij, evenals Jaspers, de effectgrootte niet overtuigend. De drie groepen verschillen weliswaar significant van elkaar, maar de grootte van die verschillen is niet in overeenstemming met de theorie. Ook blijkt uit de standaarddeviaties dat de overlap tussen de groepen aanzienlijk is. De aangrenzende groepen overlappen elkaar steeds ongeveer eenderde, wat betekent dat degenen met een borderlineorganisatie in eenderde van de gevallen een score hadden die even laag was als die van een ’psychotisch georganiseerde‘ en in eenderde van de gevallen een score die even hoog was als die van een ’neurotisch georganiseerde‘. Een gemiddelde score van ’2‘ valt voor elk van de drie persoonlijkheidsorganisaties volkomen binnen de verwachtingen. Op individueel niveau zegt het onderscheid in persoonlijkheidsorganisatie dus vrijwel niets over de te verwachten (score op) complexiteit. Nu is dat mogelijk wat veel gevraagd voor een eerste onderzoek, maar uiteindelijk pretenderen Eurelings en Snellen (2003) met deze methode op individueel niveau zinvolle uitspraken te kunnen doen en dan moeten de onderzoeksresultaten uiteindelijk ook op dat niveau enigszins te verantwoorden zijn.

Zelfs als we welwillender zijn, blijven er nog veel basale vragen over. Er worden in dit onderzoek slechts drie persoonlijkheidsorganisaties onderscheiden in plaats van de in het artikel genoemde acht (dan wel elf) en de in het boek gehanteerde dertien varianten. Bovendien behelst het onderzoek slechts één instrument van de drie tot zes instrumenten die volgens het boek (Eurelings-Bontekoe & Snellen, 2003) meestal voor de gehele DTP gebruikt worden. Hoe dan ook: na dit eerste, enige en ongerepliceerde onderzoek is nog steeds de conclusie gerechtvaardigd dat zowel de profielinterpretatie van de NVM als de gehele DTP (vrijwel) volledig in het empirisch luchtledige hangen.


Conclusies

De ambitie van Eurelings en Snellen (2003) om te komen tot een structurele, meer verklarende diagnostiek is zonder meer sympathiek en prijzenswaardig. Over de keuze voor psychodynamische verklarende theorieën kunnen de meningen verschillen, maar die is geen reden de methode bij voorbaat te verwerpen. Wel is zeker dat Eurelings en Snellen het zichzelf met deze keuze in onderzoekstechnisch opzicht niet gemakkelijk hebben gemaakt, gezien de vele complexe en moeilijk te operationaliseren begrippen die Kernbergs psychodynamische theorie met zich meebrengt. De uitwerking van de methode is creatief, maar weinig consistent en bergt grote onbetrouwbaarheden in zich. De empirische onderbouwing ontbreekt, met inachtneming van het gepubliceerde onderzoek, nog zo goed als volledig. Dat betekent niet dat de methode de prullenbak in moet, maar wel dat toepassing vooralsnog onverantwoord is.

Na de verschijning van ons artikel in de Psycholoog (Smid & Kamphuis, 2005) hebben we veel spontane en krachtige bijval geoogst van leidende figuren uit de diagnostiek in Nederland, vooral uit de groep die te typeren is als scientist-practioners. Toch wordt de DTP onderwezen, zowel pre- als postdoctoraal, en breed klinisch toegepast. Hoe is de aantrekkingskracht van de DTP onder clinici te begrijpen? Blijkbaar leeft er bij vele diagnostici een diepgevoelde behoefte om verklarend bezig te zijn, om diagnostiek en theorie met elkaar te verbinden en niet alleen de pathologie te beschrijven, maar ook de persoonlijkheid en de bijbehorende etiologie. De fraaie, bloemrijke beschrijvingen die uit de profielinterpretatie voortvloeien, contrasteren daarbij pijnlijk met de drogere, zuinigere, maar empirisch onderbouwde interpretaties die men uit de handleidingen kan halen. De wens om, zoals Eurelings en Snellen het in hun boek noemen, ’de totale persoon te verstehen‘ is mooi maar gevaarlijk. Het deed een van ons terugdenken aan een hoofdstuk van Shafer, die al in 1964 wees op de beweegredenen en valkuilen van psychologische testers: ’But in all of us, even if well repressed or well controlled, there is this longing for omniscience, for oracular powers, and as testers we must cope with constant stimulation of this longing‘ (Shafer, 1964, p. 23). Hier lijkt vooral de ’orakelbehoefte‘ in het geding.

Clinici moeten zich blijven realiseren dat individuele persoonlijkheidsdiagnostiek op een solide empirische basis moet berusten. Dat is geen wetenschappelijke muggenzifterij; het heeft te maken met verantwoord en zorgvuldig omgaan met patiënten en het minimaliseren van de kans op een foute diagnose, waar patiënten in het gunstigste geval niets aan hebben en in het ongunstigste geval ernstig door geschaad kunnen worden.

Volgens ons zou het wenselijk en opportuun zijn om de cursussen in de DTP te schorsen totdat de profielinterpretatiemethode eenduidig is ontwikkeld en enige empirische evidentie geniet. Praktijkinstanties zullen zich naar onze mening eveneens de vraag moeten stellen of ze klinische toepassing van het systeem voor hun rekening kunnen (en durven) nemen. Ons recente artikel in de Psycholoog (Smid & Kamphuis, 2005) en het debat in het Tijdschrift voor Psychotherapie dragen in elk geval bij tot een situatie waarin diagnostici met informed consent kunnen kiezen of ze de DTP wel of niet willen gebruiken.


Epiloog

Voor de ontwikkeling van de DTP zal in eerste instantie de manier waarop de persoonlijkheidsorganisatie vastgesteld wordt, nu nog door de NVM, beter uitgewerkt en getoetst moeten worden. Eurelings en Snellen (2005) stippen in hun dupliek enigszins triomfantelijk aan dat de uit de MMPI-2 gedestilleerde NVM-2 niet bruikbaar is voor deze profielinterpretatie. Die triomfantelijkheid lijkt misplaatst. De NVM is uit de handel genomen en illegaal kopiëren van de NVM kan de gebruiker hoge boetes opleveren. Als Eurelings en Snellen in hun ambities serieus genomen willen worden, moet daar echt een oplossing voor komen.


Literatuur

Eurelings-Bontekoe, E.H.M., & Snellen, W.M. (2003). Dynamische Persoonlijkheidsdiagnostiek, Lisse: Swets & Zeitlinger.
 
Eurelings-Bontekoe, E.H.M., & Snellen, W.M. (2005). Dupliek op het kritische commentaar van Jaspers. Tijdschrift voor Psychotherapie, 31, 59-66.
 
Eurelings-Bontekoe, E.H.M., Snellen, W.M., Verschuur, M.J., & Bosch, M. (2005). Een aanzet tot constructvalidering van de profielinterpretatie van de Nederlandse verkorte MMPI (NVM). Een onderzoek met behulp van de TAT. Tijdschrift voor Psychotherapie, 31, 29-49.
 
Evers, A., Vliet-Mulder, J.C. van, & Groot, C.J. (2000). Documentatie van tests en Testresearch in Nederland, Deel II Testresearch. Assen: Van Gorcum.
 
Jaspers, J.P.C. (2005). Construcvalidering van de NVM-profielinterpretatie: fundering of drijfzand?. Tijdschrift voor Psychotherapie, 31, 50-58.
 
Jonker, K., & Snellen, W.M. (1991). Individuele verschillen, diagnostiek in perspectief. Tijdschrift voor Psychiatrie, 33, 317-330.
 
Kernberg, O.F. (1984). Severe personality disorders. Psychotherapeutic strategies. New Haven, Londen: Yale University Press.
 
Luteijn, F., & Barelds, D.P.H. (2003). NPST, Negativisme, Ernstige Psychopathologie en Somatisering Test, handleiding. Lisse: Swets & Zeitlinger B.V.
 
Luteijn, F., & Kok, A.R. (1985). NVM, Nederlandse Verkorte MMPI, Handleiding. Lisse: Swets & Zeitlinger.
 
Schafer, R. (1964). Psychoanalytic interpretation in Rorschach testing: Theory and application. New York: Grune & Stratton.
 
Shedler, J., & Westen, D. (2004). Refining personality disorder diagnoses: integrating science and practice. American Journal of Psychiatry, 1161, 1350-1365.
CrossRef
 
Smid, W.J., & Kamphuis, J.H. (2005). Bedenkingen bij de dynamisch-theoriegestuurde profielinterpretatie. De Psycholoog, 2, 71-75.
 
Snellen, W.M. (1993). De voordelen van diagnostiek met behulp van persoonlijkheidsvragenlijsten. In E.H.M. Eurelings-Bontekoe (red.), Persoonlijkheidsdiagnostiek in de ambulante geestelijke gezondheidszorg (pp. 33-41). Amsterdam: NIP-sectie Ambulante Geestelijke Gezondheidszorg.
 
Snellen, W.M. (1990). MMPI- en NVM-profielen bij borderline-persoonlijkheden. In J.J.L. Derksen en F.J.S. Donker (red.), De borderline patiënt. Diagnostiek, behandeling en onderzoek (pp. 72-81). Amersfoort, Leuven: Acco.
 
Westen, D. (1991). Clinical assessment of object relations using the TAT. Journal of Personality Assessment, 56, 56-74.
CrossRef ChemPort PubMed
 
Naar boven