De toepassing van vragenlijsten bij het onderzoek van patiënten met klachten van de schouder. Vragenlijsten bij patiënten met schouderproblemen. Welke vragenlijst past het best bij de actuele klinische situatie?
Door:
Gerard Koel
Fysiotherapeut, MSc, eerstelijns praktijk Wooldersteen Hengelo, docent fysiotherapie, Saxion kenniscentrum ‘Gezondheid, welzijn en technologie’, Enschede.
Paul van der Tas
Sportfysiotherapeut en MusculoSkeletaal echografist (docent)
Beide auteurs zijn bestuurslid van de Stichting SchouderNetwerken Nederland.
Key points
Abstract en kader
Vragenlijsten zijn relevant om subjectieve klachten en klinische verschijnselen van patiënten op efficiënte en correcte wijze te kwantificeren. Het op systematische wijze toepassen van lijsten verbetert de inzichtelijkheid en objectiviteit van het fysiotherapeutisch handelen. Rond schoudergerelateerde klachten zijn tientallen lijsten ontwikkeld, soms gericht op schouderaandoeningen in het algemeen, soms op specifieke aandoeningen zoals instabiliteit of peesrupturen, lijsten die variëren voor wat betreft de minimale en maximale score als ook voor de richting van die score; bij de ene lijst duidt een hoge score op een goede en bij een andere lijst op een slecht functionerende schouder.
In dit artikel beschrijven auteurs eerst de methodologische kwaliteit van een achttal vragenlijsten per vragenlijst de betrouwbaarheid (ICC waarde), nauwkeurigheid (het minimaal detecteerbare verschil), de responsiviteit (het klinisch relevante verschil) en de praktische hanteerbaarheid (gemak van invullen) weer te geven.
Omdat geen van de acht lijsten adequaat te gebruiken is in situaties na een operatie voegen de auteurs een zelf ontwikkelde negende lijst, de SST-PO, toe. Op basis van klinische expertise en toegepast onderzoek koppelen de auteurs de negen vragenlijsten aan elf frequent voorkomende klinische schouderproblemen. Daarnaast is het gebruik van de lijsten vereenvoudigd door spreadsheets te ontwikkelen waardoor na invulling de score vanzelf wordt berekend. De score voor alle lijsten is veranderd in een zogenaamde SNT score van 0 (‘het gaat erg slecht’) tot 100 (‘het gaat erg goed’). Doel van het artikel is fysiotherapeuten behulpzaam te zijn in de keuze van een adequate vragenlijst die toegepast wordt om het behandelresultaat te evalueren en kwantificeren.
Het SchouderNetwerk Twente (www.schoudernetwerk.nl) is opgericht in 2008, bestaat uit een honderdtal fysiotherapeuten en beoogt een enthousiasmerende vereniging te zijn die regionaal het fysiotherapeutisch handelen rond patiënten met schouderaandoeningen optimaliseert. De onderlinge kwaliteit wordt gerealiseerd door als voorwaarde voor lidmaatschap het volgen van een tweetal cursussen te stellen. Gedurende een verenigingsjaar ontvangen de leden twee keer ter beoordeling een wetenschappelijke studie voorzien van een tiental vragen. De antwoorden op die vragen worden tezamen met de praktische consequenties van de studie gepresenteerd tijdens de halfjaarlijkse workshop. Deelname aan deze activiteiten is verplicht. Op de website zijn deze studies en workshops te zien.
Het SNT heeft goede contacten met de schouder orthopeden in de 3 regionale ziekenhuizen. Afspraken over het eenduidig klasseren van patiënten en dus ook het op systematische wijze toepassen van vragenlijsten zijn een belangrijk onderdeel. Via de website kunnen fysiotherapeuten de negen beschreven vragenlijsten als excel bestand downloaden inclusief de omrekening naar overeenkomende scores van 0 tot 100. Het SNT hoopt op die wijze een bijdrage te leveren aan de kwaliteit van het fysiotherapeutisch handelen.
Inleiding
Vragenlijsten zijn relevant om de subjectieve klachten en klinische verschijnselen van patiënten op efficiënte en correcte wijze te kwantificeren. Het op systematische wijze toepassen van lijsten verbetert de inzichtelijkheid en objectiviteit van het fysiotherapeutisch handelen (1). In de context van schoudergerelateerde klachten zijn tientallen lijsten ontwikkeld, soms gericht op schouderaandoeningen in het algemeen, soms op specifieke aandoeningen zoals instabiliteit of peesrupturen, lijsten die variëren voor wat betreft de minimale en maximale score als ook voor de richting van die score; bij de ene lijst duidt een hoge score op een goede en bij een andere lijst op een slecht functionerende schouder.
De lijsten kennen vooral een evaluatief gebruik; dat wil zeggen dat therapeuten de lijsten toepassen om te scoren of de individuele patiënt vooruit of achteruit is gegaan. Kortom een score op tijdstip 0 bij aanvang van de therapie en scores onderweg (‘Gaat het de goede kant op?’) en aan het eind (‘Wat is het eindresultaat?’). Daardoor is het ook mogelijk om de prognose correct in te schatten (Bijvoorbeeld: ‘Acht weken na een Neer decompressie dient de CMS score 65 punten te bedragen.’). Er zijn geen lijsten die diagnostische waarde hebben (Bijvoorbeeld: ‘Bij een score boven het afkappunt spreken we van unidirectionele GH instabiliteit.’).
In dit artikel wordt fysiotherapeuten een handreiking gedaan om de methodiek van het SchouderNetwerk Twente (SNT) te gaan toepassen. Negen geselecteerde lijsten met scores tussen de 0 en 100 die zijn gekoppeld aan de meest voorkomende schouderaandoeningen. Doel is op die wijze een systematische toepassing van lijsten te faciliteren waardoor de kwaliteit van het fysiotherapeutisch handelen bij patiënten met schouderaandoeningen verbetert.
Over de kwaliteit van vragenlijsten
De kwaliteit van meetinstrumenten en dus ook vragenlijsten wordt bepaald door een viertal kenmerken: reproduceerbaarheid, validiteit, responsiviteit en praktische hanteerbaarheid (2).
Aan reproduceerbaarheid zijn twee aspecten te onderscheiden; betrouwbaarheid (Engels: ‘reliability’) of te wel hoe stabiel klasseert het instrument personen in hoge en lage responders om patiënten en niet-patiënten betrouwbaar te onderscheiden en nauwkeurigheid (Engels: ‘agreement’; soms ook ‘overeenstemming’ of ‘precisie’ genoemd), of te wel wat is de meetfout van het instrument en in hoeverre wordt bij hertest van dezelfde patiënt precies dezelfde score gemeten (3,4). De formule waarmee de betrouwbaarheid wordt berekend, wordt bepaald door zowel de variantie van de meetuitslagen als de variantie van de meetfouten, terwijl in de formule voor het berekenen van de nauwkeurigheid alleen rekening gehouden wordt met de variantie in de meetfouten.
De betrouwbaarheid wordt uitgedrukt in een getal tussen 0 en 1 (hoe dichter bij 1, hoe betrouwbaarder) en de nauwkeurigheid in een getal in dezelfde eenheid als die van het meetinstrument (hoe kleiner de meetfout, hoe nauwkeuriger of preciezer is de meting).
De validiteit heeft betrekking op de vraag of het meetinstrument daadwerkelijk meet wat het beoogt te meten. Er worden verschillende soorten validiteit onderscheiden; zoals construct validiteit (het meetinstrument past bij een geldig theoretisch kader), criterium validiteit (het meetinstrument wordt vergeleken met de gouden standaard) of expert validiteit (het meetinstrument wordt door deskundigen als valide beoordeeld). De mate van validiteit wordt weergegeven in kenmerken als sensitiviteit, specificiteit, voorspellende waarden of likelihood ratio’s. De lijsten gaan allen over het scoren van klachten, gestoorde functies en participatie problemen die het gevolg zijn van een aandoening van de schouder. De items van de lijsten bepalen of de lijst geschikt (of te wel valide) is in een bepaalde klinische situatie. Het is dan ook niet zinvol om een lijst voor instabiliteit of chronisch pijnsyndroom toe te passen in situaties waarin sprake is van een ongecompliceerd subacromiaal impingement syndroom.
De responsiviteit is belangrijk voor een meetinstrument dat wordt gebruikt ter evaluatie van het beloop. Een responsief instrument kwantificeert een relevante klinisch verandering bij de patiënt. Als patiënt of therapeut vinden dat sprake is van een relevante klinische verbetering of verslechtering dient dat weerspiegeld te worden in de score van het instrument.
Uiteraard is een goede praktische hanteerbaarheid ook van belang; belangrijke aspecten zijn duidelijkheid van de items, snelheid van invullen en bepalen van de score. Als laatste rest dan de interpretatie van die score voor het gezondheidsprobleem van de patiënt.
Negen geselecteerde vragenlijsten voor schouderproblemen
De selectie van de lijsten vond plaats op basis van gegevens uit diagnostische studies (3-11), beschikbaarheid, gerichtheid op veel voorkomende schouderaandoeningen en praktische ervaring. Er is een zelf ontwikkelde vragenlijst toegevoegd, de SST-PO, omdat geen van de andere lijsten bruikbaar is in de eerste 3 maanden in het postoperatieve beloop. In tabel 1 worden de negen geselecteerde lijsten weergegeven voorzien van de originele en relevante bronverwijzing.
Tabel 1. De negen geselecteerde vragenlijsten met bronnen (eerstgenoemde bron betreft de originele studie van de lijst met daarbij het jaartal van introductie).
Het betreft 8 zelfrapportage lijsten die door de patiënt zelf kunnen worden ingevuld en 1 lijst (de CMS) die deels subjectief (zelfrapportage) is en deels (semi) objectief omdat de mobiliteit en de kracht worden gescoord. De meeste vragenlijsten zijn ontwikkeld voor het Engelse taalgebied; een vertaling van zo’n lijst dient zorgvuldig plaats te vinden.
Gebruikelijk is het voorleggen van een vertaalde lijst aan een ‘native’ Engelstalige persoon om de lijst te laten terug vertalen. Eventuele verschillen met de originele lijst dienen te worden vastgesteld en zo nodig gecorrigeerd. Van de 9 geadviseerde lijsten zijn er 2 van Nederlands afkomst (SPBV, 20; SST-PO, 34), zijn er 3 door andere auteurs vertaald (SPADI, DASH, SRQ; 26, 28) en heeft het SNT in samenwerking met Saxion hogescholen 4 lijsten vertaald (SST, CMS, OSIS en WOSI; 29, 30, 35).
Uiteraard dienen de lijsten te voldoen aan de criteria voor kwaliteit van een meetinstrument. De betrouwbaarheid wordt in het algemeen weergegeven door de ICC waarde (IntraClass Correlation coëfficiënt) die wordt uitgedrukt in een getal tussen 0 en 1 (de ICC wordt bepaald door de variantie van de meetuitslagen bij patiënten te delen door de som van de variantie van de meetuitslagen bij patiënten plus de variantie op basis van meetfouten; ICC = σ2pat / σ2pat + σ2error). Een ICC waarde boven de 0,75 wordt aangemerkt als voldoende (31-33). Zeker voor de zelfrapportage lijsten is dit geen probleem.
Gekoppeld aan de nauwkeurigheid is het begrip MDC (Minimal Detectable Change: het minimaal vast te stellen verschil om een klinische verandering vast te stellen); de MDC wordt slechts bepaald door de variantie van de meetfout (= σ2error), en wordt uitgedrukt in een getal in dezelfde eenheid als die van het instrument (bij vragenlijsten dus in een aantal punten, 3). Indien bij een tweede meting een verandering optreedt kleiner dan de MDC, wordt dat beschouwd als een meting binnen de meetfout en niet als een klinische verandering bij de patiënt (4, 8).
Zoals aangegeven adviseren de auteurs een lijst op basis van hun klinische expertise; of te wel er is sprake van expert validiteit. Het is dan niet zinvol om de gangbare kenmerken voor validiteit te beschrijven (zoals Se, Sp, VW, LR), immers er is op basis van klinische expertise gekozen voor een lijst en die lijst vervolgens te gaan vergelijken met een andere, uit klinisch oogpunt minder geschikte lijst, is een onhandige strategie.
Gekoppeld aan de responsiviteit is het begrip MCIC (Minimal Clinical Important Change: welke verandering wordt door de patiënt, soms door de FT, als klinisch relevant aangemerkt, 4,11). Een nieuwe score die meer afwijkt dan de MCIC duidt op een daadwerkelijke verandering (vooruitgang of achteruitgang) bij de patiënt. Soms is de MCIC niet bekend en wordt de responsiviteit gescoord met de effect size ((ES = (gemiddelde score op T1 – gemiddelde score op T0) / de standaard deviatie van de meting op T0)) of de standardized response mean ((SRM = (gemiddelde score op T1 – gemiddelde score op T0) / de standaard deviatie van de verschilscore)). Een nadeel van de ES en de SRM is dat ‘vreemde’ verhouding getallen worden geproduceerd die niet zijn te associëren met de daadwerkelijke eenheid van de meting. De volgende interpretatie wordt gebruikt: ES en SRM waardes < 0,5: geringe, van 0,5 tot 0,8: redelijke en boven de 0,8: sterke responsiviteit (24).
De praktische hanteerbaarheid van de lijsten is goed; ze zijn vrij snel in te vullen, worden goed begrepen door de patiënten en leiden snel tot een eindscore. Alleen de CMS bestaat voor 65% uit ‘objectieve’ scores van de ROM en de kracht en dient door de FT te worden gescoord.
Een belangrijk voordeel van de negen door het SNT geadviseerde lijsten is het feit dat de scores worden omgerekend naar een score tussen de 0 en 100 punten waarbij een score richting 0 een slechte functie en richting 100 een optimale functie van de schouder aangeeft. Tabel 2 toont de mate waarin de 8 lijsten voldoen aan de criteria voor de methodologische kwaliteit.
Tabel 2. De kwaliteit van de 8 geselecteerde lijsten. De data zijn gedestilleerd uit diagnostische studies (3-30); de vijf (schuingedrukte) celinhouden zijn ingeschat door de auteurs. De SST-PO is net ontwikkeld en nog niet onderzocht op methodologische kwaliteit.
Voor de afkortingen van de namen van de verschillende lijsten zie tabel 1.
Andere afkortingen; ICC: Intra Class Correlation, MDC: Minimal Detectable Change; MCIC: Minimal Clinical Important Change; ES: Effect Size; SRM: Standardized Response Mean; VAS: Visual Analoque Scale.
In de tweede kolom van tabel 2 wordt de betrouwbaarheid door middel van de ICC waarde aangegeven. Alle 8 lijsten scoren ruim voldoende voor dit item. De meetfout van de lijsten bedraagt tussen de 10 en de 23 punten; de minimaal klinisch relevante verschillen bedragen tussen de 19 en de 25 punten. De MDC (kolom 3) en de MCIC’s (kolom 4) zijn reeds omgerekend naar lijsten die scoren van 0 tot 100. De effect sizes (ES) en standardized response mean (SRM) scoren, indien onderzocht, een duidelijke voldoende.
Concluderend geldt dat de meeste lijsten een goede betrouwbaarheid kennen, dat de meetfout tussen de 15 – 20 punten bedraagt en dat relevante klinische verschillen een verschil van minstens 20 punten nodig hebben. Hoewel de SST-PO nog onderzocht dient te worden, gaan de auteurs er van uit dat dezelfde waarden gelden; dus een meetfout van 15-20 punten en een klinisch relevant bij verschillen van meer dan 20 punten.
De uitgebreidheid van de lijsten en het gegeven dat bij de CMS ook ‘objectief’ gemeten dient te worden, bepalen de praktische toepasbaarheid. Uitgebreide lijsten worden alleen geadviseerd indien uitgebreide klinische symptomen relevant zijn.
Praktische consequenties
Op dit moment formuleren auteurs de volgende interpretaties over de lijsten.
Vervolgens worden de kenmerken van de lijsten gekoppeld aan veel voorkomende schouderaandoeningen om de adviezen voor praktische toepassing weer te geven. Tabel 3 toont die relatie.
Tabel 3.De toepasbaarheid van de 9 lijsten gekoppeld aan de klinische situatie. Een ‘X’ betekent: advies om toe te passen; (X) betekent eventueel toepassen; een lege cel betekent niet toepassen. Afkortingen. PO: PostOperatief; AIOS: Acquired (anterior) Instability by Overuse of Shoulder ; AMBRI: Atraumatisch Multidirectioneel Bilateraal, Revalidatie Inferior shift; TUBS: Traumatisch Unidirectioneel Bankart Surgery; SLAP: Superior Labrum plus Anterior & Posterior rand.
Het SNT adviseert om bij alle patiënten met schouderaandoeningen de SST te scoren en die score te gebruiken om het verloop te evalueren. In postoperatieve situaties wordt het beloop in de eerste 3 tot 4 maanden getoetst met de SST-PO. Later kunnen ook andere scorelijsten worden gebruikt zeker met het oogmerk het uiteindelijke resultaat (6 tot 12 manden) te kunnen vergelijken met de pre-operatieve situatie of met niet-geopereerde patiënten of gezonde personen. Indien kracht en ROM relevant zijn, en dat is vaak het geval, wordt de CMS score bepaald. Standaardisering over de wijze waarop actieve ROM en de kracht worden bepaald, is daarbij noodzakelijk. In geval van instabiliteit waarbij de fysieke aspecten op de voorgrond staan wordt gebruik gemaakt van de OSIS en van de WOSI indien de klachten ook meer psychosociale aspecten kennen. In geval van uitgebreide schoudergerelateerde klachten wordt de SRQ toegepast. Indien klachten over de gehele bovenste extremiteit domineren wordt de DASH geadviseerd.
Afronding
De inhoud van tabel 2 toont dat veel onderzoek is uitgevoerd naar de kwaliteit van vragenlijsten voor het scoren schoudergerelateerde klachten. Hoewel etie de kwaliteit van lijststen,veel onderzoek is uitgevoerd naar de kwaliteit van vragenlijsten voor de schoudergerelateerde kligenlijk elke subgroep van patiënten met een schouderaandoening apart onderzocht dient te worden om vast te stellen wat de kwaliteit van de lijsten in die situatie is, is de huidige ‘state of the art’ ver genoeg als motivatie voor de beschreven adviezen. Gezien de zelfrapportage speelt de invloed van de fysiotherapeut als bron voor vertekening een kleine rol. Overigens is in tabel 2 bij de CMS de interbeoordelaar betrouwbaarheid en nauwkeurigheid genoteerd. De inhoud van tabel 2 toont aan dat inmiddels voldoende gegevens aanwezig zijn. Het blijkt dat de waarden voor de MDC iets lager liggen dan voor de MCIC hetgeen betekent dat daadwerkelijke klinische veranderingen leiden tot veranderingen in de scores van lijsten. Het verkleinen van de MDC door de toepassing te standaardiseren is aan te raden.
De inhoud van dit artikel gecombineerd met de veelal eenvoudige toepassing en interpretatie, de makkelijke toegankelijkheid van de lijsten en de positieve effecten op de kwaliteit van het fysiotherapeutisch handelen motiveert om de lijsten in de praktijk toe te passen.
Literatuurlijst