Samenvatting
Beoordeling van 130 kernaanbevelingen uit 28 standaarden. Huisarts Wet 2002;45(7):349-53. Inleiding De NHG-Standaarden vormen al jaren een breed geaccepteerde, wetenschappelijke basis voor het huisartsgeneeskundig handelen. De kwaliteit van de richtlijnen is echter nog nooit systematisch onderzocht. Methode Een panel van twaalf huisartsen beoordeelde 130 kernaanbevelingen geselecteerd uit 28 NHG-Standaarden (gepubliceerd in 1993-1997) met behulp van een instrument dat bestaat uit tien items onderverdeeld in drie dimensies (wetenschappelijke onderbouwing, compatibiliteit met dagelijkse praktijk en uitvoerbaarheid). Resultaten Een minderheid van de aanbevelingen (44%) werd ondersteund met een bespreking van wetenschappelijk onderzoek. De therapeutische aanbevelingen waren vaker onderbouwd (67%) dan de aanbevelingen voor diagnostiek (35%) en voorlichting (29%). De meeste aanbevelingen vereisten geen nieuwe kennis (75%), vaardigheden (86%) of aanpassingen in de organisatie (88%). De uitvoerbaarheid werd vooral beperkt doordat er in 43% van de gevallen een verandering van bestaande routines werd vereist. De beoordelaars verwachtten bij 39% van de aanbevelingen negatieve reacties van patiënten. Conclusies De wetenschappelijke onderbouwing van de NHG-Standaarden kan verbeterd worden. De aansluiting met de dagelijkse praktijk en de uitvoerbaarheid van de aanbevelingen zijn in het algemeen redelijk tot goed, hetgeen ook kan betekenen dat de aanbevelingen de gangbare praktijk weerspiegelen.
Inleiding
Ondanks het lange bestaan en de brede acceptatie van de NHG-Standaarden is er betrekkelijk weinig onderzoek gedaan naar de kwaliteit van de standaarden. Toch heeft de kwaliteit geregeld ter discussie gestaan. 1 , 2 , 3 , 4 Afgezien van enkele algemene beschouwingen 5 , 6 , 7 , 8 , 9 is er nooit systematisch onderzoek gedaan naar de kwaliteit van de aanbevelingen in de standaarden. Dit staat in schril contrast met de talloze empirische onderzoeken naar de implementatie en toepassing van de standaarden. 10
Een probleem bij het onderzoeken van de kwaliteit van richtlijnen is het ontbreken van een gevalideerd beoordelingsinstrument. 11 De hamvraag luidt aldus: waar moeten goede aanbevelingen aan voldoen? In de discussies en literatuur over richtlijnen zien we steeds de volgende basiscriteria terugkomen: 5, 6, 12 , 13 , 14 , 15
- De aanbeveling dient zoveel mogelijk wetenschappelijk te zijn onderbouwd.
- De aanbeveling dient aan te sluiten bij de dagelijkse praktijkvoering (compatibiliteit).
- De aanbeveling dient uitvoerbaar en toepasbaar te zijn in de praktijk.
Wij wilden nagaan in hoeverre de aanbevelingen in de NHG-Standaarden aan deze criteria voldoen. Ook waren we geïnteresseerd in eventuele verschillen tussen aanbevelingen voor diagnostiek, voorlichting, behandeling, controle of verwijzing.
Methoden
Ontwikkeling van beoordelingscritera
Op basis van literatuur 12 , 13 , 14 , 15 stelden we een lijst van criteria op om de drie dimensies – wetenschappelijke onderbouwing, compatibiliteit met bestaande praktijk en uitvoerbaarheid – te operationaliseren. Bij de wetenschappelijke onderbouwing gaat het vooral om de beschikbaarheid van empirische onderzoeken ( evidence) en de verslaglegging daarvan in het notenapparaat. Als empirisch onderzoek ontbreekt, kan een bespreking van de voor- en nadelen de lacune in kennis deels vullen. De volledigheid en juistheid van de onderbouwing werd niet getoetst omdat dit een meer uitgebreide, specifiek klinisch-inhoudelijke beoordeling vereist. Bovendien staan er in de standaarden geen zoek- en selectiecriteria vermeld waarmee de methode van literatuurverzameling kan worden getoetst. 16 Bij compatibiliteit gaat het zowel om de aansluiting bij de normen en waarden van de huisarts als om de beleving en te verwachten reacties van patiënten. De uitvoerbaarheid wordt bepaald door de mate waarin nieuwe kennis of vaardigheden of veranderingen in de routines en organisatie vereist zijn. De criteria werden specifiek en ondubbelzinnig geformuleerd waarbij overlap tussen de criteria zoveel mogelijk werd vermeden. Het definitieve ‘beoordelingsinstrument’ bestond uit tien criteria ( tabel 1).
1 | De onderbouwing van de aanbeveling wordt expliciet beschreven. |
2 | De aanbeveling wordt hoofdzakelijk onderbouwd met wetenschappelijk onderzoek. |
3 | De aanbeveling wordt ondersteund met een bespreking van de voordelen van het opvolgen van de aanbeveling (kans op toename van gezondheid of kwaliteit van leven). |
4 | De aanbeveling wordt ondersteund met een bespreking van de nadelen van het opvolgen van de aanbeveling (schadelijke effecten, bijwerkingen, risico's). |
5 | De aanbeveling strookt met de normen en waarden van de bestaande klinische praktijk. |
6 | De aanbeveling roept geen negatieve reacties op bij patiënten. |
7 | De toepassing van de aanbeveling vereist geen nieuwe kennis. |
8 | De toepassing van de aanbeveling vereist geen nieuwe vaardigheden. |
9 | De toepassing van de aanbeveling vereist geen aanpassingen in de organisatie. |
10 | De toepassing van de aanbeveling vereist geen verandering van bestaande routines en gewoonten. |
Selectie van aanbevelingen
Voor dit onderzoek maakten we gebruik van de gegevens van het project ‘Toetsen Aan Standaarden’ (TAS-project). 17 Dit project had onder meer als doel via zelfregistratie tijdens consulten na te gaan in hoeverre de belangrijkste aanbevelingen uit de standaarden daadwerkelijk worden opgevolgd. Hiertoe werden met behulp van een panel van richtlijndeskundigen 324 concrete kernaanbevelingen geselecteerd uit 29 NHG-Standaarden (gepubliceerd in 1993-1997). Bij de selectie van standaarden werd gestreefd naar een evenwichtige verdeling over de verschillende ‘ICPC-hoofdstukken’ en over chronische en niet-chronische aandoeningen. Het was voor ons echter ondoenlijk de kwaliteit van alle 324 kernaanbevelingen betrouwbaar te beoordelen. Derhalve selecteerden we (JB, JZ) ongeveer een derde van de aanbevelingen op grond van de volgende criteria:
- gemiddeld vier tot vijf aanbevelingen per standaard (met een maximum van acht);
- een evenwichtige verdeling over de verschillende fasen van het consult (diagnostiek, voorlichting, niet-medicamenteuze en medicamenteuze behandeling, controle en verwijzing);
- voldoende prevalentie van de condities van de aanbevelingen, af te lezen aan het aantal consultregistratieformulieren dat werd terugontvangen in het TAS-project.
Uiteindelijk werden zo 130 aanbevelingen uit 28 standaarden geselecteerd ( tabel 2).
Wat is bekend?
- Hoewel de NHG-Standaarden een geaccepteerde basis vormen voor het handelen van de huisarts, is de kwaliteit van de aanbevelingen nooit systematisch onderzocht.
Wat is nieuw?
- Minder dan de helft van de belangrijkste aanbevelingen uit de standaarden wordt ondersteund met een bespreking van wetenschappelijk onderzoek.
- De therapeutische aanbevelingen zijn vaker onderbouwd dan aanbevelingen voor diagnostiek en voorlichting.
- De meeste aanbevelingen sluiten goed aan bij de dagelijkse praktijk en zijn goed uitvoerbaar.
M01 | Diabetes mellitus type II (6) |
M04 | Enkeldistorsie (2) |
M09 | Otitis media acuta (4) |
M13 | Perifeer arterieel vaatlijden (5) |
M15 | Acne vulgaris (2) |
M18 | Otitis media met effusie bij kinderen (3) |
M19 | Migraine (4) |
M20 | Cholesterol (5) |
M28 | Vaginaal bloedverlies (5) |
M34 | Acute diarree (4) |
M37 | Constitutioneel eczeem (5) |
M38 | Fluor vaginalis (5) |
M41 | Reumatoïde artritis (4) |
M43 | Angina pectoris (8) |
M44 | Depressie (6) |
M45 | TIA (5) |
M48 | Allergische en hyperreactieve rhinitis (5) |
M49 | Otitis externa (4) |
M51 | Hartfalen (5) |
M54 | Lage rugpijn (5) |
M55 | Lumbosacraal radiculair syndroom (4) |
M57 | Het rode oog (5) |
M36 | Maagklachten, 1996 (5) |
M17 | Hypertensie, 1997 (7) |
M26 | Astma bij volwassenen en COPD – diagnostiek, 1997 (5) |
M27 Astma bij volwassenen – behandeling, 1997 (5) M27 COPD – behandeling, 1997 (6) M42 Bemoeilijkte mictie bij oudere mannen, 1997 (5) |
Beoordeling van aanbevelingen
We stelden een extern, onafhankelijk panel van twaalf huisartsen samen om de aanbevelingen met behulp van de opgestelde criteria te beoordelen. Alle panelleden hadden ruime ervaring als praktiserend huisarts en door hun nevenwerkzaamheden inzicht in de algemene huisartsgeneeskundige praktijkvoering. De aanbevelingen werden verdeeld in zes groepen waarbij aanbevelingen over eenzelfde tractus zoveel mogelijk in eenzelfde groep werden opgenomen. Elke groep aanbevelingen werd door twee panelleden onafhankelijk van elkaar beoordeeld. Zij moesten van elke aanbeveling nagaan of deze het criterium al dan niet bezat (dichotome schaal). De tekst van de betreffende NHG-Standaarden kon hierbij worden geraadpleegd. Bij het scoringsformulier zat een handleiding die toelichting gaf over de beoordeling ( appendix, zie www.artsennet.nl/nhg/henw). De resultaten werden vervolgens teruggekoppeld, waarna aan elk koppel werd gevraagd om door overleg overeenstemming te krijgen over alle oordelen. Het overeenstemmingspercentage vóór overleg was gemiddeld 71% (gemiddelde kappa 0,24; spreiding 0-0,47). Na overleg kon in uiteindelijk 99% van de gevallen overeenstemming worden bereikt.
Analyse
De dimensiescores werden bepaald door het gemiddelde percentage van de afzonderlijke criteria te berekenen. De scores werden geaggregeerd en per consultfase geanalyseerd.
Resultaten
Algemeen
Van alle 130 aanbevelingen waren er 80 (62%) expliciet onderbouwd, meestal met een toelichting in een bijbehorende noot ( tabel 3). In 57 van deze 80 aanbevelingen betrof het volgens het panel een onderbouwing met wetenschappelijk onderzoek, dat wil zeggen met empirische onderzoeken zoals klinische trials of observationeel onderzoek. In meer dan de helft (56%) van alle aanbevelingen was er echter geen sprake van een dergelijke onderbouwing. Een bespreking van de voordelen kwam bij 41% van de aanbevelingen voor, terwijl de nadelen slechts bij 14% van de aanbevelingen werden besproken.
Criteria | Criterium aanwezig (%) | |||
---|---|---|---|---|
1 | expliciete onderbouwing | 80 | (62) | |
2 | wetenschappelijk onderzoek | 57 | (44) | |
3 | bespreking voordelen | 54 | (41) | |
4 | bespreking nadelen | 18 | (14) | |
5 | compatibel met normen en waarden | 109 | (84) | |
6 | geen negatieve reacties bij patiënten | 79 | (61) | |
7 | geen nieuwe kennis vereist | 97 | (75) | |
8 | geen nieuwe vaardigheden vereist | 112 | (86) | |
9 | geen aanpassingen in organisatie vereist | 114 | (88) | |
10 | geen verandering van routines vereist | 74 | (57) |
Scores per consultfase
De geselecteerde aanbevelingen bestonden voor 39% uit diagnostische aanbevelingen en voor 32% uit therapeutische aanbevelingen. De overige aanbevelingen betroffen voorlichting (16%), controle (9%) en verwijzing (3%). De therapeutische aanbevelingen werden vaker ondersteund met wetenschappelijk onderzoek (67%) dan de diagnostische aanbevelingen (35%) en aanbevelingen voor voorlichting en controles (29%) ( tabel 4). Bij de niet-medicamenteuze aanbevelingen kwamen relatief vaker de voordelen ter sprake (69%), terwijl bij de medicamenteuze aanbevelingen relatief vaker de nadelen, bijvoorbeeld bijwerkingen besproken werden (38%).
Diagnostiek | Voorlichting | Niet-Medicamenteuze behandeling | Medicamenteuze behandeling | Controle en verwijzing | ||
---|---|---|---|---|---|---|
(n=51) | (n=21) | (n=16) | (n=26) | (n=16) | ||
33,8 | 27,4 | 54,7 | 61,2 | 33,9 | ||
1 | expliciete onderbouwing | 63 | 48 | 75 | 82 | 50 |
2 | wetenschappelijk onderzoek | 35 | 29 | 63 | 71 | 37 |
3 | bespreking voordelen | 33 | 24 | 69 | 58 | 43 |
4 | bespreking nadelen | 0 | 0 | 13 | 38 | 13 |
74,5 | 69,0 | 59,4 | 80,8 | 68,8 | ||
5 | compatibel met normen en waarden | 90 | 81 | 87 | 77 | 75 |
6 | geen negatieve reacties bij patiëenten | 59 | 57 | 31 | 85 | 63 |
77,1 | 75,0 | 68,3 | 87,5 | 78,1 | ||
7 | geen nieuwe kennis vereist | 68 | 81 | 69 | 81 | 87 |
8 | geen nieuwe vaardigheden vereist | 90 | 80 | 80 | 96 | 94 |
9 | geen aanpassingen in organisatie vereist | 88 | 86 | 87 | 96 | 87 |
10 | geen verandering van routines vereist | 60 | 52 | 38 | 77 | 44 |
Beschouwing
Uit dit onderzoek blijkt dat de belangrijkste aanbevelingen uit de NHG-Standaarden in het algemeen aansluiten bij de dagelijkse praktijkvoering en redelijk tot goed uitvoerbaar en toepasbaar zijn. Dat geldt zowel voor de aanbevelingen voor diagnostiek als voor de aanbevelingen voor het beleid. De wetenschappelijke onderbouwing van de aanbevelingen, met name die voor diagnostiek, voorlichting, controle en verwijzing, laat echter nog te wensen over. Hoewel de meeste aanbevelingen een verwijzing hadden naar een noot of referentie, was een onderbouwing met empirische onderzoeken slechts bij een minderheid aanwezig. Dit kan te wijten zijn aan het eenvoudigweg ontbreken van kwalitatief goede onderzoeken. Zo bleek uit het onderzoek van Tasche et al. dat er per standaard gemiddeld 12,5 lacunes in kennis bestonden, waarvan het merendeel op het gebied van diagnostiek en medicamenteuze behandeling. 18 Uit een nadere inhoudelijke analyse bleek dat 42 onderzoeksvragen in de ‘lacunebak’ in het onderzoek van Tasche betrekking hadden op aanbevelingen in ons onderzoek. Deze lacunes kwamen echter slecht overeen met onze bevindingen, omdat ons panel vond dat wetenschappelijk onderzoek (criterium 2) maar in 14 van deze 42 aanbevelingen (33%) afwezig was. De kwaliteit van het onderzoek werd – in tegenstelling tot het onderzoek van Tasche – niet door ons panel beoordeeld, hetgeen de discrepantie kan verklaren. De aanwezigheid van wetenschappelijk onderzoek sluit een lacune in kennis immers niet uit, vooral als het onderzoek van matige kwaliteit betreft. Een zorgvuldige argumentatie met een bespreking van de voor- en nadelen van het opvolgen van de aanbeveling kan vaak aanvullende informatie geven over de kwaliteit van de onderbouwing, maar dat werd slechts bij een minderheid van de aanbevelingen gedaan. Sommige aanbevelingen, zoals het advies om meer dan normaal te drinken bij acute diarree of de contactlenzen uit te laten bij een rood oog, zijn echter zo evident dat een onderbouwing of argumentatie minder noodzakelijk wordt geacht.
De compatibiliteit met de normen en waarden van de bestaande praktijk was hoog. De beoordelaars meenden daarentegen dat een aanzienlijk deel (circa 40%) van de aanbevelingen negatieve reacties bij patiënten zou kunnen oproepen. Dat gold met name voor de niet-medicamenteuze aanbevelingen (69%). Dit lijkt vooral te wijten aan het grote aandeel aanbevelingen met minder populaire adviezen zoals het stoppen met roken. Of patiënten de aanbevelingen ook als negatief zien, is niet nagegaan. Er is echter nogal eens een discrepantie tussen wat dokters denken dat patiënten vinden en wat deze werkelijk vinden. 19
De goede compatibiliteit en uitvoerbaarheid van de meeste aanbevelingen kan ook worden verklaard doordat ze reeds de gangbare praktijk beschrijven en dus geen gedragsverandering vereisen. Toch vonden we dat in ongeveer 40% van de aanbevelingen een verandering van routines was vereist. Hierbij moet worden opgemerkt dat voor dit kenmerk de overeenstemming tussen de twee panelleden vóór overleg relatief laag was (60%). Waarschijnlijk zullen de routines en gewoonten van dokter tot dokter verschillen.
Om een aantal redenen dienen we voorzichtig te zijn met het trekken van al te stellige conclusies op grond van dit onderzoek. We hebben getracht de kwaliteit van de NHG-Standaarden te meten met behulp van criteria ontleend aan andere kwaliteitsinstrumenten. 12, 14 De validiteit van deze criteria is echter onbekend en ook nauwelijks te toetsen vanwege het ontbreken van een gouden standaard. Dit is een bekend probleem bij het beoordelen van richtlijnen. 20, 21 Daarnaast is de beoordeling van met name de compatibiliteit en uitvoerbaarheid nogal subjectief. We hebben dit enigszins ondervangen door de panelleden te vragen het oordeel van de huisarts in het algemeen als uitgangspunt te nemen en niet hun persoonlijke opinie of praktijkvoering. Toch is het niet uitgesloten dat de samenstelling van het panel de beoordeling heeft beïnvloed. Tot slot werden in dit onderzoek geen aanbevelingen uit recente NHG-Standaarden opgenomen. De helft van de standaarden in ons onderzoek is inmiddels herzien. Het is mogelijk dat de wetenschappelijke onderbouwing in de loop der jaren beter is geworden, zodat onze beoordeling niet zonder meer mag worden geëxtrapoleerd naar de huidige verzameling geldige NHG-Standaarden.
Dankbetuiging
We bedanken de volgende huisartsen voor hun bijdrage aan het beoordelen van de aanbevelingen: Aria Biemond, Rob Dijkstra, Roel Drijver, Bernard Frijling, Paul Janssen, Marijke Labots-Vogelesang, Vroon Pigmans, Ber Pleumeekers, Berend Terluin, Siep Thomas, Cees in 't Veld en Michel van Wijk.
Literatuur
- 1.↲Dunk JHM. Pseudo-wetenschappelijk. Huisarts Wet 1990;33:330-1.
- 2.↲Te Dorsthorst JGJM. Standaarden. Huisarts Wet 1993;36:32.
- 3.↲Te Dorsthorst JGJM. De NHG-standaard Epicondylitis. Een voorbeeld van een onvoldoende wetenschappelijk gefundeerde richtlijn. Huisarts Wet 1997;40:671-3.
- 4.↲De Jongh TOH, Van Ruijven AGH.Waarom sluiten NHG-standaarden onvoldoende aan bij de diagnostiek van de huisarts? Huisarts Wet 2000;43:340-2.
- 5.↲↲Rutten GEHM. Criteria en waarborgen voor de kwaliteit van NHG-standaarden. Huisarts Wet 1990;33:338-9.
- 6.↲↲Meijman FJ. Publicatie van protocollen: ja, mits… Huisarts Wet 1990;33:414.
- 7.↲Burgers JS. De wetenschappelijke onderbouwing van de NHG-standaarden. Huisarts Wet 1994;37:188-93.
- 8.↲Wiersma Tj, Meulenberg F, Burgers JS. Helderheid en consistentie van standaarden: een kwestie van coherentie. Huisarts Wet 1995;38:175-7.
- 9.↲Burgers JS. NHG-Standaarden en de invloed van evidence-based medicine. In: Geijer RMM, Burgers JS, Van der Laan JR, Wiersma Tj, Rosmalen CFH, Thomas S. NHG-Standaarden voor de huisarts, deel 1. Maarssen: Elsevier/Bunge 1999:11-23.
- 10.↲Grol R, Wensing M, redactie. Implementatie: effectieve verandering in de patiëntenzorg. Maarssen: Elsevier gezondheidszorg, 2001.
- 11.↲Graham ID, Calder LA, Hébert PC, Carter AO, Tetroe JM. A comparison of clinical practice guideline appraisal instruments. Int J Technol Assess Health Care 2000;16:1024-38.
- 12.↲↲↲Field S, Lohr K. Guidelines for clinical practice. From development to use. Washinghton (DC): National Academy Press, 1992.
- 13.↲↲Grol R, Dalhuijzen J, Mokkink H, In 't Veld C, Rutten G, Mokkink H. Attributes of clinical guidelines that influence use of guidelines in general practice: observational study. BMJ 1998;317:858-61.
- 14.↲↲↲The AGREE Collaboration. Appraisal of Guidelines for Research & Evaluation (AGREE) Instrument. www.agreecollaboration.org, 2001. Bezocht op 30 januari 2002.
- 15.↲↲Burgers JS, Grol R, Zaat J. Richtlijnen en protocollen als hulpmiddel bij de verbetering van de zorg. In: Grol R, Wensing M, redactie. Implementatie: effectieve verandering in de patiëntenzorg. Maarssen: Elsevier gezondheidszorg, 2001.
- 16.↲Meijman F. Controleerbaarheid van informatie: meer dan een aantal voetnoten. Huisarts Wet 1994;37:173-5.
- 17.↲Spies TH, Mokkink HGA. Toetsen aan standaarden. Het medisch handelen van huisartsen in de praktijk getoetst: eindrapportage.Nijmegen: Werkgroep Onderzoek Kwaliteit, Utrecht: Nederlands Huisartsen Genootschap (NHG), 1999.
- 18.↲Tasche MJA, Oosterberg EH, Kolnaar BGM, Rosmalen CFH. Inventarisatie van lacunes in huisartsgeneeskundige kennis. Zeventig standaarden doorgelicht. Huisarts Wet 2001;44:91-4.
- 19.↲Jung HP, Wensing M, Grol R. What makes a good general practitioner: do patients and doctors have different views? Br J Gen Pract 1997;47:805-9.
- 20.↲Shaneyfelt TM, Mayo-Smith MF, Rothwangl J. Are guidelines following guidelines? The methodological quality of clinical practice guidelines in the peer-reviewed medical literature. JAMA 1999;281:1900-5.
- 21.↲Grilli R, Magrini N, Penna A, Mura G, Liberati A. Practice guidelines developed by specialty societies: the need for a critical appraisal. Lancet 2000;355:103-5.
Reacties
Er zijn nog geen reacties.