Erster Zwischenbericht für das Modell zur psychischen ... · Vorbereitung der Erhebung und...

60
Abschlussbericht an das Bundesministerium für Gesundheit und Soziale Sicherung (BMGS) Am Probsthof 78a; 53121 Bonn Vorbereitung der Erhebung und Auswertung zur Prävalenz des Aufmerksamkeits-Defizit- Hyperaktivitäts-Syndroms (ADHS) in Deutschland im Rahmen des Kinder- und Jugendsurveys des Robert-Koch-Instituts Dr. med. Dipl.-Psych. Michael Huss Facharzt für Kinder- und Jugendpsychiatrie Oberarzt an der Klinik für Psychiatrie, Psychosomatik und Psychotherapie des Kindes- und Jugendalters Charité Universitätsmedizin Berlin Campus Virchow-Klinikum Augustenburger Platz 1; 13353 Berlin

Transcript of Erster Zwischenbericht für das Modell zur psychischen ... · Vorbereitung der Erhebung und...

Abschlussbericht

an das

Bundesministerium für Gesundheit

und Soziale Sicherung (BMGS)

Am Probsthof 78a; 53121 Bonn

Vorbereitung der Erhebung und Auswertung zur

Prävalenz des Aufmerksamkeits-Defizit-

Hyperaktivitäts-Syndroms (ADHS) in Deutschland

im Rahmen des Kinder- und Jugendsurveys des

Robert-Koch-Instituts

Dr. med. Dipl.-Psych. Michael Huss

Facharzt für Kinder- und Jugendpsychiatrie

Oberarzt an der Klinik für Psychiatrie, Psychosomatik und Psychotherapie

des Kindes- und Jugendalters

Charité Universitätsmedizin Berlin Campus Virchow-Klinikum

Augustenburger Platz 1; 13353 Berlin

1. Verzeichnisse

1.1 Inhaltsverzeichnis

1. VERZEICHNISSE......................................................................................................................... 2

1.1 Inhaltsverzeichnis...................................................................................................................................... 2

1.2 Tabellenverzeichnis................................................................................................................................... 3

1.3 Abbildungsverzeichnis.............................................................................................................................. 3

2. ZUSAMMENFASSUNG ............................................................................................................... 4

3. THEORETISCHER HINTERGRUND: DER BEDARF AN NATIONALEN PRÄVALENZDATEN5

4. WAS IST BEKANNT?.................................................................................................................. 8

5. DER GESUNDHEITS-SURVEY DES ROBERT-KOCH-INSTIUTS ALS GRUNDLAGE EINER DEUTSCHEN PRÄVALENZSCHÄTZUNG................................................................................ 12

6. HOHE PRÄVALENZDATEN IN DER FORSCHUNGSLITERATUR: EIN METHODISCHES ARTEFAKT? .............................................................................................................................. 14

7. OPERATIONALISIERUNG DER FORSCHUNGSFRAGE IM HAUPTSURVEY....................... 17

7.1 Forschungskriterien................................................................................................................................ 17

7.2 Im Hauptsurvey bereits implementierte Items..................................................................................... 19 7.2.1 Strengths and Difficulties Questionnaire (SDQ)............................................................................... 19 7.2.2 Rating trainierter Beobachter ............................................................................................................ 20 7.2.3 Objektive Verfahren.......................................................................................................................... 23 7.2.4 Diagnosealgorithmus auf der Grundlage der im Hauptsurvey implementierten Informationen........ 24

8 SDQ-ERGEBNISSE AUS DEM PRETEST ................................................................................... 35

9 ERGEBNISSE DES RELIABILITÄTS-TRAINING FÜR DEN HAUPTSURVEY........................... 43

10 WELCHE VORLÄUFIGEN PRÄVALENZSCHÄTZUNGEN ERGEBEN SICH AUS DEN BISHER VERFÜGBAREN DATEN DES PRETESTS?............................................................. 46

11 ZUSAMMENFASSENDE WERTUNG UND AUSBLICK........................................................... 50

12 LITERATUR ............................................................................................................................... 52

13 ANHANG .................................................................................................................................... 53 13.1 Beschreibung des Doppler-Radar-Aktometer ....................................................................................... 53 13.2 SPSS-Steuerfile SDQ-Auswertung ....................................................................................................... 54

2

1.2 Tabellenverzeichnis

Tabelle 1: Original-Items, mit denen das Verhalten während der Untersuchung eingeschätzt wird (nach Conners adaptiert) ....................................................................................................................................................... 21

Tabelle 2: HKS-Diagnosealgorithmus .................................................................................................................. 25 Tabelle 3: Schwellenwerte der SDQ-Skalen nach Goodman (www.sdqinfo.com)............................................... 36 Tabelle 4: Deskritpivstatistik der SDQ-Skalen gegliedert nach Stichprobe.......................................................... 40 Tabelle 5: Varianzanalytischer Vergleich der Skalenwerte zwischen den Stichproben........................................ 42 Tabelle 6: Kappa-Gewichte für die Berechnung der ordinalen Urteilsübereinstimmung ..................................... 43 Tabelle 7: Kappa-Ergebnisse des Reliabilitätstests gegliedert nach Items, Skalen und Gesamt-Mittelwert......... 45 Tabelle 8: Anteil auffälliger HKS-Scores (Schwellenwertmodell) gegliedert nach Stichprobe ........................... 47 Tabelle 9: Deskriptivstatistik des Impact-Scores in der Klinikstichprobe ............................................................ 47

1.3 Abbildungsverzeichnis

Abbildung 1: Altersverteilung der HKS-Rohwerte gegliedert nach Geschlecht und Stichprobe.......................... 38 Abbildung 2: Skalenmittelwerte mit 95%igem Konfidenzintervall gegliedert nach Stichprobe .......................... 41

3

2. Zusammenfassung

Das Hyperkinetische Syndrom (HKS) bzw. das Aufmerkamkeits-Defizit-Hyperaktivitäts-

Syndrom (ADHS) gilt als die häufigste psychiatrische Störung im Kindes- und Jugendalters.

Prävalenzschätzungen gehen von etwa 5% betroffener Schulkinder aus. Trotz der erheblichen

gesundheitspolitischen Bedeutung der Prävalenz des ADHS/HKS liegen keine hinreichend

wissenschaftlich abgesicherten Daten für die Bundesrepublik Deutschland vor. Studien

insbesondere aus dem anglo-amerikanischen Sprachraum weisen erhebliche Schwankungen

bezüglich der Prävalenzen auf (4% bis 26%).

In dem Forschungsbericht wird die Notwendigkeit nationaler Prävalenzdaten erläutert.

Weiterhin werden Gründe für die erhebliche Schwankungsbreite bisheriger internationaler

Studien angeführt. In diesem Zusammenhang wird auf ein methodisches Artefakt verwiesen,

das bei dem Einsatz der klassischen dimensionalen Verfahren (SDQ, CBCL, Conners-Skalen)

zu einer Überschätzung der Prävalenz führt (Verletzung der Normalverteilungsannahme).

Vorschläge werden unterbreitet, dieser Überschätzung zu begegnen.

Als aktuell größte repräsentative bundesdeutsche Querschnittserhebung bietet sich im Kinder-

und Jugend Gesundheitssurvey, der unter Leitung von Frau Dr. Kurth am Robert-Koch-

Institut durchgeführt wird, die Gelegenheit, nationale Prävalenzdaten zu bestimmen. In

diesem Zusammenhang war es möglich, neben den bereits verfügbaren Fragebogenverfahren

ein Untersuchertraining sowie eine objektive Messung der motorischen Unruhe mittels Radar-

Aktometrie in dem Kernsurvey zu verankern.

In einem Vergleich der Survey-Vorstudie (sog. Pretest mit n = 1.364 Kindern und

Jugendlichen) mit einer parallel gezogenen Inanspruchnahme-Stichprobe in der Klinik für

Kinder- und Jugendpsychiatrie (Leitung: Frau Prof. Lehmkuhl) an der Charité Berlin (n =

1.221) werden orientierende SDQ-Analysen zu Alters- und Geschlechtseffekten, sowie zur

Schätzung der ADHS/HKS-Prävalenz durchgeführt.

Es wird ein Algorithmus vorgestellt, nach dem nationale Prävalenzdaten berechnet werden

können. Methodische Stärken und Schwächen des Algorithmus werden diskutiert.

Schließlich erfolgt eine theoriegeleitete Schätzung der Prävalenz von ADHS/HKS. Es

resultiert ein oberer Schätzwert der Prävalenz von 3,9%.

4

3. Theoretischer Hintergrund: Der Bedarf an nationalen Prävalenzdaten

Das Hyperkinetische Syndrom (HKS) bzw. die Aufmerksamkeits-Hyperaktivitäts-Störung

(ADHS) gilt als die häufigste psychische Auffälligkeit im Kindes- und Jugendalters. In einer

Vielzahl von Studien konnte gezeigt werden, dass insbesondere Kinder mit nicht behandeltem

ADHS/HKS eine ungünstige Prognose hinsichtlich ihrer persönlichen und beruflichen

Entwicklung haben. Erste Studien über die ökonomischen Auswirkungen der Störung lassen

die hohen Kosten erahnen, die dem Gesundheitssystem mittel- und langfristig durch

ADHS/HKS-Betroffene entstehen (Barkley 2002).

In den öffentlichen Medien ist ADHS/HKS seit Jahren ein kontroverses Thema. Dabei

werden die Symptome der Störung meist verkürzt dargestellt (z.B. ‚wirkt verträumt’; ‚hat

Wutausbrüche’; ‚bleibt nicht bei der Sache’), so dass bei verunsicherten Eltern schnell der

Eindruck entsteht, das eigene Kind sei ebenfalls betroffen. Merkmale, aus denen man ableiten

kann, dass das eigene Kind nicht betroffen ist, finden sich in den Beiträgen öffentlicher

Medien nur sehr selten.

Aus gesundheitspolitischer Sicht ist es von zentraler Bedeutung, eine intensive Aufklärung

über die tatsächlichen – und in der Regel wesentlich strengeren - Kriterien der Störung

anzustreben. Darüber hinaus gilt es zu klären, ob und wenn ja wo in Deutschland von Über-,

Unter- und Fehlversorgung des ADHS/HKS auszugehen ist. Für nahezu alle

gesundheitspolitischen Ansätze ist die Kenntnis über die zu erwartende Häufigkeit der

Störung (Prävalenz) maßgeblich.

Über Definition, Diagnose und Behandlung des ADHS/HKS konnte in Deutschland in

Abstimmung mit den internationalen Fachgesellschaften und der verfügbaren

wissenschaftlichen Evidenz ein breiter Konsens gefunden werden. Über die Prävalenz der

Störung liegen allerdings für die Bundesrepublik Deutschland bislang keine repräsentativen

Daten vor. Alle bisherigen Angaben beruhen auf Studien, die in anderen Ländern – meist in

den USA – durchgeführt wurden. Verfügbare deutsche Daten stammen entweder nicht aus

repräsentativen Stichproben bzw. legen Instrumente zugrunde, aus denen das Vorliegen eines

ADHS/HKS nicht abgeleitet werden kann (Schmeck et al. 2001).

5

Die Bedeutung nationaler Prävalenzdaten ist in mehrer Hinsicht erheblich:

A) Wie den Angaben des Statistischen Bundesamtes (www.destatis.de/basis/d/bevoe-

/bevoetab5.htm) zu entnehmen ist, lebten im Jahr 2002 in der Bundesrepublik Deutschland

7.791.100 Kinder im Alter zwischen 6 und 15 Jahren. Weichen die Prävalenzschätzungen um

einen Prozentpunkt nach oben ab, so entspricht dies bereits rund 80.000 Kindern, von denen

zusätzlich angenommen wird, dass sie psychisch erkrankt seien. Umgekehrt bedeutet eine

Unterschätzung der tatsächlichen Störung um einen Prozentpunkt, dass für die gleiche Anzahl

an Kindern dringend benötigte Therapieangebote möglicherweise nicht vorgehalten werden

und so dem ungünstigen Verlauf der Störung Vorschub geleistet wird.

B) Ist die Prävalenz der Störung bekannt, so lassen sich bei derzeit jährlich steigenden

Verordnungen von Methylphenidat frühe Rückschlüsse auf Arzneimittel-Missbrauch bzw.

nicht leitlinien-konforme Verordnungen ziehen (hierzu ist die Kenntnis zusätzlicher

Parameter erforderlich wie beispielsweise der zu erwartende Anteil der ADHS/HKS-Kinder,

die nach den therapeutischen Leitlinien eine pharmakologische Behandlung benötigen).

C) Angesichts steigender Verordnungen von Stimulanzien bei Kindern stellt sich die Frage,

ob wir es mit einer realen Zunahme an ADHS/HKS im Sinne einer erhöhten Inzidenz zu tun

haben. Auf der Basis mehrerer Prävalenzbestimmungen lassen sich epidemiologische

Aussagen zu einem möglichen Anstieg der Erkrankungshäufigkeit machen.

D) Die Prävalenz ist ein basaler Parameter der Versorgungsforschung. Nur auf der Grundlage

von zuverlässigen Prävalenzdaten lassen sich jeweils an den wirtschaftlichen und

gesellschaftlichen Verhältnissen optimierte Kosten-Nutzen-Modelle im Gesundheitswesen

realisieren.

E) Die Kenntnis der Prävalenz ist auch wichtig für die Evaluation von diagnostischen Tests in

der Medizin. Will man beispielsweise die positiven oder negativen Vorhersagewerte eines

Tests bewerten, so ist dazu die Kenntnis der Prävalenz der jeweiligen Störung erforderlich.

Was ist derzeit über die Prävalenz von ADHS/HKS in Deutschland bekannt?

In Lehrbüchern und populärwissenschaftlichen Arbeiten finden sich diesbezüglich erhebliche

Schwankungen. Unterschiede von bis zu 10 Prozentpunkte sind keine Seltenheit und hängen

angesichts fehlender nationaler Daten in erster Linie davon ab, welche internationale

Studienergebnisse auf Deutschland übertragen wurden.

Wir hatten oben bereits auf den nachhaltigen Effekt solcher ungenauer Prävalenzdaten

hingewiesen: In Absolutzahlen bedeutet für Deutschland ein Anstieg der Prävalenz um einen

6

Prozentpunkt, dass bei zusätzlichen 80.000 Kindern davon ausgegangen wird, dass sie an

einem ‚ADHS/HKS’ erkrankt sind.

Da wissenschaftlich hochwertige Erhebungen von nationalen Prävalenzdaten mit einem

erheblichen Forschungsaufwand verbunden sind, sei aus forschungsökonomischer Sicht

zunächst die Frage aufgeworfen, welcher Erkenntnisgewinn aus einem solchen Projekt zu

erwarten ist.

Ein wesentlicher Nutzen besteht darin, in Zukunft nicht mehr auf Daten anderer Länder -

insbesondere den USA - angewiesen zu sein und damit Fehleinschätzungen in Kauf nehmen

zu müssen. Damit ließen sich einer Reihe von Fehlerquellen ausschließen, die in Kapitel 4

noch genauer erläutert werden:

- Kulturelle Einflüsse (je nach Kulturkreis werden unterschiedliche Verhaltensweisen in

unterschiedlichem Ausmaß als auffällig eingeschätzt)

- Genetische Einflüsse (nationale Unterschiede hinsichtlich der genetischen Belastung;

beispielsweise wird durch die sog. Gen-shift-Hypothese eine höhere Prävalenz von

ADHS/HKS in den USA postuliert)

- Einflüsse unterschiedlicher Klassifikationssysteme (in den USA wird nach DSM-IV,

in den meisten europäischen Ländern nach ICD-10 klassifiziert)

Der unter Leitung von Frau Dr. Kurth am Robert-Koch-Institut durchgeführte Kinder- und

Jugend Gesundheitssurvey (nachfolgend auch als Hauptsurvey bezeichnet) bietet eine

einzigartige Möglichkeit, nationale Prävalenzdaten zu bestimmen.

Gegenstand des vorgelegten Forschungsberichts ist es, Möglichkeiten und Grenzen

aufzuzeigen, wie anhand der Daten aus dem Gesundheits-Survey möglichst valide ADHD-

Prävalenzschätzungen für Deutschland vorgenommen werden können. Darüber hinaus

werden Ergebnisse des Pretests im Vergleich zu einer Klinikstichprobe sowie Ergebnisse des

Untersucher-Trainings im Hauptsurvey mitgeteilt.

7

4. Was ist bekannt?

Auf den mittlerweile zahlreichen Konsensuskonferenzen über ADHS/HKS werden einheitlich

Prävalenzen von ca. 5% angenommen. Die Forschungsliteratur zeigt im Gegensatz zu diesen

Schätzwerten allerdings ein sehr heterogenes Bild.

Eine gründliche Sichtung der verfügbaren US-amerikanischen Originalarbeiten aus dem

Publikationszeitraum von 1980 bis 1997 haben Brown und Mitarbeiter (2001) vorgelegt. Wie

die Autoren betonen, variieren die empirisch ermittelten Prävalenzdaten für ADHS erheblich.

Sie reichen von 4% (Pelham et al. 1992) bis 26% (Newcorn et al. 1994). Erwartungsgemäß

werden die Ergebnisse von dem zu Grunde gelegten Diagnose-Schema (DSM III, DSM-IIIR

oder DSM-IV) beeinflusst. Auch die Erhebungsmethoden (Interview vs. Fragebogen) und die

Art der Informationsquellen (Eltern-, Lehrer-, Selbst-, Klinikerurteil bzw. entsprechende

Kombinationen) wirken sich auf die Prävalenz aus.

Weiterhin sind demographische Einflüsse (Stadt vs. Land), kulturelle, ethnische, sozio-

ökonomische und insbesondere geschlechtsbezogene Effekte bekannt (Wender 2002).

Bislang liegt nur eine Arbeit vor, die auf Interview-Daten nach dem 1994 veröffentlichten,

aktuellen amerikanischen Klassifikationssystem (DSM-IV) beruht. Es handelt sich dabei um

die Studie von Wolraich und Mitarbeitern (1998), die an 4.323 Kindergarten- und

Schulkindern bis zur fünften Klasse durchgeführt wurde. Ein wesentliches Qualitätsmerkmal

der Studie ist es, dass - in Übereinstimmung mit den aktuellen diagnostischen Kriterien - die

Beeinträchtigung des psychosozialen Funktionsniveaus berücksichtigt wurde. Wolraich et al.

(1998) ermittelten eine Prävalenz für alle Subtypen von ADHS von insgesamt 6,8%.

Ist dieser Wert auch für Deutschland zu erwarten? Wie eingangs erwähnt, sollten

transkulturelle Verallgemeinerungen insbesondere bei kinderpsychiatrischen Störungsbildern

nur mit großer methodischer Zurückhaltung oder gar nicht erfolgen, da mit einer Vielzahl von

Fehlerquellen zu rechnen ist. Diese seien nachfolgende im Detail erläutert:

A) Wie in einer kulturvergleichenden Studie (Huss et al. 2002) gezeigt werden konnte,

weisen beispielsweise die Conners-Skalen (Conners 1989), die bis heute als

‚Klassiker’ in der ADHS/HKS-Forschung gelten, deutliche Unterschiede im

Urteilsverhalten deutscher und US-amerikanischer Eltern auf. Die Unterschiede

beruhen nicht auf einfachen ‚Sollwertverschiebungen’, die aus methodischer Sicht

ohne großen Aufwand durch eine Lineartransformation korrigiert werden könnten.

8

Vielmehr zeigte sich, dass die drei Hauptsymptome des ADHS

(Aufmerksamkeitsprobleme, mangelnde Impulskontrolle und gesteigerte motorische

Unruhe) unterschiedlich anfällig für Kultureffekte sind.

Während für die Aufmerksamkeitsstörungen nahezu keine Unterschiede zwischen den

Kulturen nachweisbar waren, fanden wir bei der Einschätzung der motorischen

Unruhe mittelgradige Unterschiede. Die stärksten Abweichungen waren für die

Störungen der Impulskontrolle (impulsives und aggressives Verhalten) zu

verzeichnen. Ohne differenzierte Kenntnis dieser Effekte lassen sich deutsche Daten

nicht mit hinreichender Sicherheit als auffällig oder unauffällig einschätzen.

Darüber hinaus konnte unsere Arbeitsgruppe zeigen, dass es bei international

eingesetzten Fragebogen möglicherweise kulturgebundene semantische Effekte gibt,

die sich bis in die Faktorenstruktur hinein nachweisen lassen (Huss et al. 2001). Auch

unter diesem Gesichtspunkt ist eine nationale Validierung internationaler Verfahren

geboten.

B) US-amerikanische Studien beruhen auf dem Klassifikationssystem der

Amerikanischen Psychiatrischen Gesellschaft (APA), dem sog. DSM-IV. In

Deutschland sind die Ärzte jedoch verpflichtet, nach dem Klassifikationssystem der

WHO, der sog. ICD-10 zu diagnostizieren. Hinsichtlich der Items unterscheiden sich

beide Systeme nicht, so dass eine Transformation auf Itemebene möglich ist.

Unterschiede ergeben sich allerdings in dem Algorithmus, nach dem die Diagnose auf

der Grundlage der Items gestellt wird. So fasst das DSM-IV die beiden

Hauptkategorien ‚Impulsivität’ und ‚Hyperaktivität’ zu einer Klasse zusammen. Das

ICD-10 trennt diese. Andererseits müssen nach DSM-IV die Symptome nur in zwei

von drei Settings (Familie, Schule, Praxis/Klinik) auftreten. Nach Lesart des ICD-10

müssen dagegen die Probleme in allen drei Settings nachweisbar sein. Die DSM-IV

Kriterien sind damit insgesamt als ‚weicher’ einzuschätzen, was mit einer höheren

Prävalenz der Störung einhergeht.

C) Die bisherige Forschung über die Ursachen der Störung weist auf starke genetische

Einflussfaktoren hin. Berechnungen auf der Grundlage von Zwillingsstudien ergaben

einen genetischen Anteil von bis zu 80% (Ding et al. 2002). Man geht heute von

einem polygenetischen Erbgang mit variabler Genexpression aus. Als maßgebliche

9

genetische Einflussgrößen haben sich Allele des DRD4 Gens und des DAT1 Gens

erwiesen. International vergleichende Genanalysen, wie sie beispielsweise von Prof.

Swanson (persönliche Kommunikation, 2002; (Ding et al. 2002)) vorgestellt wurden,

legen für das 7bp-repeat Allel des D4-Rezeptors eine Wanderbewegung nach

Nordamerika nahe (Teil der sog. Gen-Shift-Hypothese). Auf der Grundlage dieser

Befunde muss zwischen den Kontinenten eine unterschiedliche genetische Disposition

in Betracht gezogen werden. Dies müsst sich auch in den jeweiligen Prävalenzdaten

niederschlagen.

In der wegweisenden Studie von Wolraich et al. (1998) findet sich ein weiteres wichtiges

Detail: Die ermittelte Prävalenz von 6,8% kommt nur dann zustande, wenn neben den

Symptomausprägungen auch die Auswirkungen auf das sog. psychosoziale Funktionsniveau

des Kindes berücksichtigt werden. Wird nur aufgrund der Symptome, nicht aber aufgrund der

damit verbundenen Einschränkung des Funktionsniveaus bewertet, so steigt die Prävalenz auf

16% an.

Wie kommt es zu diesem erheblichen Anstieg?

Bekanntermaßen lässt sich kein psychiatrisches Krankheitsbild ausschließlich nach der

Quantität von Symptomen definieren. Maßgeblich ist immer die Auswirkung auf die Person

bzw. das psychosoziale Umfeld. Man spricht in diesem Zusammenhang von dem sog.

Leidensdruck, den ein bestimmtes Symptom oder ein Symptomkomplex bewirkt.

Psychometrisch erfasst werden die Auswirkungen der Störung in der Regel durch das bereits

erwähnte psychosoziale Funktionsniveau.

Dies gilt auch für ADHS/HKS. Als Spezifikum kommt jedoch hinzu, dass die drei

Hauptsymptome des ADHS – mangelnde Aufmerksamkeit, Impulsivität und motorische

Unruhe – jeweils ein Kontinuum darstellen. Jungen sind insgesamt über alle Altersstufen

hinweg stärker betroffen als Mädchen.

Damit wird auch verständlich, warum in der Studie von Wolraich et al. (1998) unter

Missachtung des psychosozialen Funktionsniveaus überproportional viele Jungen zusätzlich

in die diagnostische Kategorie ‚ADHS’ fallen. Aus biologischer Sicht muss angenommen

werden, dass u.a. das dopaminerge System bei Jungen quantitativ und möglicherweise auch

qualitativ anderen Entwicklungsprozessen unterworfen ist. Das gruppenstatistisch über alle

Bevölkerungen und Kulturen hinweg bei Jungen vermehrt nachweisbare Symptom der

motorischen Unruhe darf - auch in Kombination mit einer geringeren

Aufmerksamkeitsleistung und einer geringeren Impulskontrolle – nicht mit einer

10

kinderpsychiatrischen Störung gleichgesetzt werden, allenfalls mit einem Risikofaktor für

ADHS/HKS.

Der Vorgang, wie aus einem Symptom eine Störung wird, ist wesentlich komplexer:

ADHS/HKS generiert sich erst in einem Wechselverhältnis zwischen den biologischen und

kognitiven Möglichkeiten des Kindes und den Anforderungen, die an das Kind gestellt

werden (sog. Stress-Diathese-Modell). Unter günstigen psychosozialen und pädagogischen

Förderbedingungen kann ein genetisch belastetes Kind seine Anlage zu einem gewissen

Grade kompensieren. Eine medikamentöse Behandlung lässt sich möglicherweise vermeiden

(Huss 2002). Umgekehrt werden Kinder trotz eines geringeren genetischen Risikos

psychiatrisch auffällig, wenn sie unter sehr ungünstigen Bedingungen leben.

Wie die Studie von Wolraich et al. (1998) eindrücklich zeigt, müssen stärkere

Symptomausprägungen bei Jungen nicht mit einer Störung im Sinne einer

kinderpsychiatrischen Erkrankung einhergehen. Es ist davon auszugehen, dass das

psychosoziale Umfeld die stärker ausgeprägte Unruhe- und Impulsivität bei Jungen zum Teil

kompensiert.

Bei der Bestimmung von ADHS/HKS-Prävalenzdaten spielt daher das psychosoziale

Funktionsniveau eine maßgebliche moderierende Rolle.

Die Arbeit von Wolraich wurde in diesem Forschungsbericht exemplarisch herausgegriffen,

weil es sich dabei um eine der wenigen Studien handelt, in der mit strukturierten Interviews

diagnostiziert wurde. Dieses Verfahren ist aus zeitökonomischen Gründen im Rahmen des

Gesundheitssurveys nicht realisierbar. Die Prävalenzschätzung muss daher auf der Basis von

Fragebogen- und Beobachtungs- und Messverfahren erfolgen.

11

5. Der Gesundheits-Survey des Robert-Koch-Instiuts als Grundlage einer deutschen Prävalenzschätzung

Bei dem Kinder- und Jugend-Gesundheitssurvey handelt es sich um die erste umfassende und

bundesweit repräsentative Untersuchung zur gesundheitlichen Lage von Kindern und

Jugendlichen in Deutschland (www.kiggs.de). Die Studie ist als Querschnittsdesign

konzipiert. Die Grundgesamtheit umfasst alle Kinder und Jugendlichen im Alter zwischen 0

und 18 Jahren. Die Stichprobenziehung erfolgt nach festgelegten Repräsentativitätskriterien

anhand des Einwohnermeldeamt-Registers. Angestrebt wird eine Stichprobe von 17.100

Kindern und Jugendlichen, die in 150 Erhebungszentren bundesweit untersucht werden. Die

Studie durchlief eine Reihe von wissenschaftlichen Begutachtungen. Im Rahmen des sog.

Pretests an 1.630 Kindern und Jugendlichen konnte die Durchführbarkeit der Studie erprobt

und die potentielle Umsetzung der wissenschaftlichen Fragestellungen überprüft werden. Eine

ausführliche Beschreibung des Pretests findet sich bei Kurth und Mitarbeitern (2002).

Der Kinder- und Jugend-Gesundheitssurvey deckt folgende Themengebiete ab (siehe

Kurzbeschreibung des Projekts im PDF-Format unter www.kiggs.de).

Körperliche Beschwerden und Befindlichkeit

Akute und chronische Krankheiten

Behinderungen

Gesundheitsrisiken, Unfälle

Psychische Gesundheit und Verhaltensauffälligkeiten

Subjektive Gesundheit (Lebensqualität)

Soziale Kontakte, soziales Netz, Unterstützungsprogramme

Personale Ressourcen (Schutzfaktoren für eine gesunde psychische Entwicklung)

Ernährung, Essstörungen, Adipositas

Gesundheitsverhalten und Freizeitaktivitäten

Medikamentenkonsum, Impfstatus

Inanspruchnahme medizinischer Leistungen

12

Der Kinder- und Jugend-Gesundheitssurvey bietet hinsichtlich der Repräsentativität und des

Stichprobenumfangs nahezu optimale Bedingungen für eine Prävalenzbestimmung des

ADHS/HKS, die auf absehbare Zeit nicht mehr in dieser Form gegeben sein werden.

Angesichts des fortgeschrittenen Stadiums der Studienplanung (die Fragebogen für den

Hauptsurvey waren bereits in der Drucklegung; der Pretest war bereits abgeschlossen) sowie

des damit verbundenen hohen Zeitaufwandes, war die Durchführung eines strukturierten

kinderpsychiatrischen Interviews aus zeitlichen und organisatorischen Gründen nicht

realisierbar. Das NIMH-DISC als das bekannteste strukturierte Interview benötigt je nach

Komorbidität zwischen 1,5 bis 2,5 Stunden Untersuchungszeit. Für die Durchführung des K-

SADS als dem am häufigsten verwendeten semistrukturierten Interview sind ähnliche

Untersuchungszeiten zu veranschlagen.

Nach den heutigen international anerkannten Leitlinien für die Diagnose und Therapie des

ADHS/HKS kann eine Diagnose nur auf der Grundlage eines klinisch fundierten Interviews

gestellt werden. Mittels Fragebogen, Verhaltenseinschätzungen durch die Eltern, Angaben

über Probleme in der Schule, systematische Beobachtungen trainierter Untersucher, sowie

objektive Befunde (Aktometrie) lässt sich jedoch mit hinreichender Sicherheit eine Aussage

über das wahrscheinliche Vorliegen der Störung und somit über die Prävalenz machen. Dieses

Vorgehen wird instrumentenbezogen durch vergleichende Analysen untermauert, die an über

1.200 Patienten unserer Klinik mit dem gleichen Verfahren (SDQ) durchgeführt wurden.

Der Gesundheitssurvey beinhaltet ein reichhaltiges Instrumentarium, das auf der Grundlage

eines a-priori zu erstellenden Algorithmus als Approximation einer Diagnose genutzt werden

kann.

Eine wünschenswerte Ergänzung um eine 18 Items umfassende Diagnose-Checkliste

(SWAN) musste aus forschungsökonomischen Gründen und aus den bereits genannten

Gründen der nahezu abgeschlossenen Studienplanung fallengelassen werden. Der Vorteil des

SWAN hätte in seiner spezifischen Ausrichtung auf die ADHS-Kriterien und seiner

Verteilungseigenschaften gelegen, die den Erfordernissen epidemiologischer Studien

angepasst sind. Der SWAN ist das derzeit einzige international etablierte Verfahren, das die

Voraussetzungen einer Normalverteilung hinreichend erfüllt.

Wie Swanson und Mitarbeiter (submitted) zeigen konnten, fallen Prävalenzbestimmungen auf

der Grundlage dimensionaler Verfahren mit Likert-Antwortskalen (z.B. SDQ, CBCL,

Conners-Skalen) aufgrund der Verletzung der Normalverteilungsannahme zu hoch aus. Diese

13

Verzerrung muss bei der Interpretation der Ergebnisse des Gesundheitssurveys berücksichtigt

werden.

Ein Schwerpunkt des vorgelegten Forschungsberichts ist es, auf der Grundlage der

internationalen ADHS/HKS-Forschungskriterien einen Auswertungsalgorithmus für das

verfügbare Datenmaterial zu erstellen und Erweiterungsmöglichkeiten aufzuzeigen und ggf.

zu implementieren, mit denen das angestrebte Ziel einer validen Prävalenzschätzung

verbessert werden kann.

Mit dem beschriebenen Algorithmus lässt sich in einem weiteren Analyseschritt unter

Hinzuziehung von Daten über die Einnahme von Stimulanzien abschätzen, ob diejenigen

Kinder medikamentös behandelt wurden, die aufgrund der Symptomausprägung ihres

ADHS/HKS ein solches Vorgehen nahe legen.

Da die Angaben über den Medikamentengebrauch in dem Pretest nur aus Gründen der

Studiendurchführbarkeit, nicht aber zur Beantwortung der Frage einer leitlinien-orientierten

Behandlung von ADHS/HKS erhoben wurden und keinen Anspruch auf Repräsentativität

haben, wurden Medikamenten-bezogene Auswertungen von Seiten des RKI im Sinne guter

wissenschaftlicher Praxis nicht durchgeführt. Darüber hinaus wurden im Pretest auch nur die

Medikamente der vergangenen 7 Tage erfasst. Kinder, die jemals im Rahmen ihres

ADHS/HKS mit Stimulanzien behandelt wurden, wären nicht berücksichtigt worden. Die

große Stichprobe des Hauptsurveys sowie deren Repräsentativität stellt hingegen sicher, dass

ein valides Abbild des zum Befragungszeitpunkt aktuellen Medikamentengebrauchs für

Psychostimulanzien bei Kindern erstellt werden kann.

6. Hohe Prävalenzdaten in der Forschungsliteratur: Ein methodisches Artefakt?

Bisherige Prävalenzdaten auf der Grundlage von dimensionalen Fragebogenverfahren – wie

etwa der Conners Rating Scale (CRS), der Child Behavior Checklist (CBCL) oder des

Strengths and Difficulties Questionnaires (SDQ) – erwiesen sich in der Vergangenheit als

erstaunlich hoch. Prävalenzwerte von über 10% der Schulkinder sind dabei nicht unüblich.

Dabei stellt sich die Frage, ob bei solch hohen Prävalenzwerten noch sinnvollerweise von

14

einer Krankheit im engeren Sinn gesprochen werden kann. Würden alle anderen

Störungsbilder zusätzlich einbezogen, so wäre jedes zweite bis dritte Kind psychiatrisch

krank.

Das dimensionale Störungskonzept, das den genannten Instrumentarien (CRS, CBCL, SDQ)

zugrunde liegt, geht davon aus, dass Merkmale wie eine kurze Aufmerksamkeitsspanne,

Impulsivität und motorische Unruhe in der Bevölkerung normalverteilt sind. Die Berechnung

der jeweiligen Cut-off Werte erfolgt daher immer an bevölkerungsbezogenen

Normstichproben.

Üblicherweise werden mehr als zwei Standardabweichungen von der Norm oder Werte

oberhalb der 95. Perzentile als auffällig eingeschätzt. Je nach Fragestellung

(einseitig/zweiseitig) sind demnach extreme Werte in etwa 2,5% bzw. 5% der Fälle zu

erwarten. Robert Goodman (2001) hat abweichend von diesem Konzept für die SDQ die 90.

Perzentile als Cut-off für auffälliges Verhalten als und die 80. Perzentile als grenzwertig

definiert.

Obwohl das zugrunde gelegte Störungskonzept (und vermutlich auch die reale Verteilung in

der Bevölkerung) am besten durch eine Normalverteilung beschrieben werden kann, führen

die Itemformulierungen und die vorgegebenen Antwortmuster (z.B. 0 = überhaupt nicht, 1 =

ein wenig, 2 = ziemlich, 3 = sehr stark) in epidemiologischen Stichproben zu extrem schiefen,

J-förmigen Verteilungen, in denen die erste Antwortkategorie (0 = überhaupt nicht)

dominiert.

Dies konnte durch Ullmann und Mitarbeiter (1985) für die Conners-Skalen gezeigt werden.

Für die CBCL, die SDQ wie auch für die ADHD-Checkliste SNAP sind die J-förmigen

Verteilungen in epidemiologischen Studien hinlänglich bekannt.

Swanson und Mitarbeiter (Swanson et al. submitted) berechneten, dass die Verletzung der

Normalverteilungsannahme die Prävalenz der Störung um absolut 3% bis 4% überschätzt.

Dieser Effekt ist darauf zurückzuführen, dass die Verteilung der Merkmale im unteren

Bereich abgeschnitten ist.

Swanson und Mitarbeiter (submitted) adaptierten daher die nach den bisherigen Likert-Skalen

konstruierte SNAP, indem die Itemformulierungen neutraler bzw. positiver wurden (z.B.

SNAP-Item 9: ‚Ist bei alltäglichen Aufgaben häufig vergesslich’; SWAN-Item 9: ‚Denkt an

alltägliche Aufgaben’).

Die daraus resultierende SWAN vermeidet J-förmige Verteilungen und kommt dem Desiderat

normalverteilter Skalen in epidemiologischen Studien sehr nahe. Um die Normalverteilung

der Merkmale besser abbilden zu können, wurde auch die negativ formulierte Antwortskala in

15

eine 7stufige symmetrische Skala verändert, deren Ausprägungen auf den (neutralen)

Durchschnitt bezogen werden (-3 = deutlich unterhalb des Durchschnitts, -2 = unterhalb des

Durchschnitts, -1 = geringfügig unterhalb des Durchschnitts, 0 = Durchschnitt, 1 =

geringfügig oberhalb des Durchschnitts, 2 = oberhalb des Durchschnitts, 3 = deutlich oberhalb

des Durchschnitts).

In einer Studie mit 847 Schülern (Swanson et al. submitted) konnte nachgewiesen werden,

dass mit der neuen Formulierung keine Verletzungen der Normalverteilung mehr auftraten.

Damit eignet sich die SWAN für Prävalenzbestimmungen in epidemiologischen Studien.

Verteilungsbedingte Überschätzungen der Prävalenz von ADHS/HKS sind mit der SWAN

nicht mehr zu erwarten.

Aufgrund des weit fortgeschrittenen Planungsstadiums des Hauptsurveys sowie aus

forschungsökonomischen Gründen bei bereits als maximal einzuschätzender Belastung der

Probanden musste auf die Ergänzung des SWAN verzichtet werden. Da der Survey sehr breit

angelegt ist und die psychische Gesundheit in dem Fragen- und Untersuchungsspektrum

bereits einen sehr großen Raum einnimmt, hätte die zusätzliche Einführung des SWAN eine

Überfrachtung des Untersuchungsablaufs bedeutet und wäre möglicherweise mit einer

höheren Verweigerungsrate und damit verbundenen Einbußen bei der Repräsentativität

einhergegangen.

Die Repräsentativität und die Stichprobengröße sind wesentliche Qualitätsmerkmale des

Survey, die nicht beeinträchtigt werden sollten. Der vorgelegte Algorithmus greift daher auf

verfügbare Daten zu, ordnet diese gemäß den internationalen Forschungskriterien einem

Bewertungs-Schema zu und ergänzt dieses durch A) trainierte Beobachtungsdaten und B)

objektive Daten. Die Schlussfolgerungen werden durch vergleichende Analysen an einer

parallel erhobenen Klinikstichprobe validiert.

16

7. Operationalisierung der Forschungsfrage im Hauptsurvey

7.1 Forschungskriterien

Die Operationalisierung der Forschungsfrage erfolgt nach den ICD-10 Forschungskriterien,

die nachfolgend in Originalformulierung aufgelistet sind.

Erstes ICD-10 Hauptkriterium G1 ‚Unaufmerksamkeit’

Mind. 6 Monate bestanden mind. 6 der folgenden Kriterien:

(cave: Entwicklungsstand berücksichtigen!)

Die Kinder 1. sind häufig unaufmerksam gegenüber Details oder machen Flüchtigkeitsfehler bei den

Schularbeiten und sonstigen Arbeiten und Aktivitäten 2. sind häufig nicht in der Lage, die Aufmerksamkeit bei Aufgaben und beim Spielen

aufrechtzuerhalten 3. hören häufig scheinbar nicht, was ihnen gesagt wird 4. können oft Erklärungen nicht folgen oder ihre Schularbeiten, Aufgaben oder Pflichten

am Arbeitsplatz nicht erfüllen (nicht wegen oppositionellem Verhalten oder weil die Erklärungen nicht verstanden werden können)

5. sind häufig beeinträchtigt, Aufgaben und Aktivitäten zu organisieren 6. vermeiden ungeliebte Arbeiten, wie Hausaufgaben, die geistiges Durchhaltevermögen

erfordern 7. verlieren häufig Gegenstände, die für bestimmte Aufgaben oder Tätigkeiten wichtig

sind, z.B. Unterrichtsmaterialien, Bleistifte, Bücher, Spielsachen und Werkzeuge 8. werden häufig von externen Stimuli abgelenkt 9. sind im Verlauf der alltäglichen Aktivitäten oft vergesslich.

Zweites ICD-10 Hauptkriterium G2 ‚Überaktivität’

Mind. 6 Monate bestanden mind. 3 der folgenden Kriterien

(cave: Entwicklungsstand berücksichtigen!)

Die Kinder 1. zappeln häufig mit Händen und Füßen oder winden sich auf den Sitzen 2. verlassen ihren Platz im Klassenraum oder in anderen Situationen, in denen

Sitzenbleiben erwartet wird

17

3. laufen häufig herum oder klettern exzessiv in Situationen, in denen dies unpassend ist (bei Jugendlichen oder Erwachsenen entspricht dem möglicherweise nur ein Unruhegefühl)

4. sind häufig unnötig laut beim Spielen oder haben Schwierigkeiten, sich ruhig mit Freizeitbeschäftigungen zu befassen

5. zeigen ein anhaltendes Muster exzessiver motorischer Aktivitäten, die durch die soziale Umgebung oder Vorschriften nicht durchgreifend beeinflussbar sind.

Drittes ICD-10 Hauptkriterium G3 ‚Impulsivität’

Mind. 6 Monate bestanden mind. eines der folgenden Kriterien

(cave: Entwicklungsstand berücksichtigen!)

Die Kinder 1. platzen häufig mit der Antwort heraus, bevor die Fragen beendet sind 2. können häufig nicht in einer Reihe warten oder warten, bis sie bei Spielen oder in

Gruppensituationen an die Reihe kommen 3. unterbrechen und stören andere häufig (z.B. mischen sie sich ins Gespräch oder Spiel

anderer ein) 4. reden häufig exzessiv, ohne angemessen auf soziale Beschränkungen zu reagieren.

Zusatzkriterium: ‚Erstmaliges Auftreten’

Die Störung muss vor dem siebten Lebensjahr erstmalig aufgetreten sein

Zusatzkriterium: ‚Setting-Kriterium’

Die Störung muss situationsübergreifend d.h. in mehr als einem Setting (Familie, Schule,

Untersuchungssituation) auftreten.

Zusatzkriterium: ‚Zeitstabilität’

Die Störung muss über mind. 6 Monate bestehen. Angesichts der genetischen bzw.

neurobiologischen Einflussfaktoren muss allerdings eine lebenslange Disposition

angenommen werden, was viele Expertengremien dazu veranlasst hat, das 6-Monats-

Kriterium als methodische Untergrenze insbesondere bei jüngeren Kindern anzusehen, die in

der Praxis hinsichtlich der Dauer der Symptomausprägungen weit übertroffen werden sollte.

18

7.2 Im Hauptsurvey bereits implementierte Items

7.2.1 Strengths and Difficulties Questionnaire (SDQ)

Ein zentraler Baustein für Einschätzung psychischer Auffälligkeiten im Kinder- und Jugend

Gesundheitssurvey stellt der 25 Items umfassende Screening-Fragebogen Strengths and

Difficulties Questionnaire (SDQ) von Robert Goodman (1997) dar. Für das Instrument liegen

umfassende Daten des British Child Mental Health Survey aus dem Jahr 1999 vor. Der

britische Survey wurde an 10.438 Kindern und Jugendlichen im Alter von 5 bis 15 Jahren

durchgeführt und stellt eine ideale Vergleichsmöglichkeit für den deutschen Survey dar.

Goodman und Mitarbeiter (Goodman et al. 2000) haben zusätzlich eine Analyse über die

Prädiktion kinderpsychiatrischer Störungen mittels des SDQ auf der Grundlage der britischen

Surveys vorgelegt, die für unsere Forschungsfrage eine wichtige Bezugsgröße darstellt.

Der britische Survey unterscheidet sich jedoch in wesentlichen Punkten von dem deutschen

Survey, die für die Güte der ADHD-Prävalenzschätzung relevant sind.

Im Gegensatz zu dem deutschen Survey wurden in der britischen Studie neben den Eltern-

SDQ auch die korrespondierenden Lehrer-SDQ sowie die Schüler-SDQ (ab 11 Jahren)

erhoben. Zusätzlich wurde ein Interview auf der Basis einer Batterie von Fragebogen, Tests

und strukturierten Interview-Items durchgeführt. Das Datenmaterial wurde von Klinikern

gesichtet und sowohl dem ICD-10 als auch dem DSM-IV Schlüssel zugeordnet. Die

klinischen Rater waren blind gegenüber den SDQ-Daten.

Die Spezifität des SDQ für eine psychiatrische Diagnose lag insgesamt bei 94,6% mit einem

95%igen Konfidenzintervall zwischen 94,1% und 95,1%. Die Sensitivität wurde mit 63,3%

(KI 59,7 – 66,9%) berechnet.

In dem deutschen Survey werden diese Werte etwas schlechter ausfallen, da sich die Zahl der

Informanten unterscheidet: Der britische Survey bezieht Eltern-SDQ, Lehrer-SDQ und auch

das Selbsturteil in Form des Schüler-SDQ (ab 11 Jahren) ein. Der deutsche Survey beschränkt

sich auf das Elternurteil.

Des Weiteren fehlt in dem deutschen Survey die Impact Skala des SDQ, was eine

Einschätzung des psychosozialen Funktionsniveaus erschwert. Wie bereits in den ersten

Kapiteln des Berichts erläutert, ist nicht nur die Symptomausprägung, sondern auch der

daraus resultierende Leidensdruck für die diagnostische Einschätzung von Bedeutung.

19

In dem hier vorgelegten Abschlussbericht wird mittels einer parallel gezogenen

Klinikstichprobe eine Grundlage geschaffen, den Impact-Score auf konservativem Wege zu

schätzen.

Insgesamt ist in dem deutschen Survey von einer geringeren Prädiktionskraft für die

ADHS/HKS-Prävalenz auf der Grundlage der SDQ- und begleitenden Daten auszugehen. In

Abwägung der methodischen Einschränkungen bezogen auf die Bestimmung des ADHS/HKS

und der ansonsten optimalen Survey-Bedingungen (Repräsentativität, Stichprobengröße)

sollten jedoch die avisierten Analysen zur Bestimmung der Prävalenz und Behandlung von

Kindern mit ADHS/HKS vorangetrieben werden, da sie die auf absehbare Zeit einzigen und

aussagekräftigsten Ergebnisse darstellen werden und somit von erheblichen

gesundheitspolitischen Nutzen sind.

7.2.2 Rating trainierter Beobachter

Die Interviewer des Gesundheitssurvey wurden anhand von Videomaterial der Klinik

geschult. Das Videomaterial rekrutierte sich aus 130 Filmen aus der BfArM-Langzeitstudie

von Kindern und Jugendlichen, die multiaxial mittels strukturierten kinderpsychiatrischen

Interviews diagnostiziert wurden. Ergänzt wurde das Videomaterial durch exemplarische

Bänder von Patienten unserer Klinik. Für die forschungsbezogene Verwendung der Bänder

für Trainingszwecke liegt ein schriftliches Einverständnis vor.

Das Training wurde am 9. Mai 2003 in Berlin durchgeführt. Zunächst erfolgte eine

umfassende theoretische Schulung bezüglich der diagnostischen Kriterien, insbesondere

bezüglich der drei Hauptsymptome Aufmerksamkeitsstörung, Impulskontrollstörung und

motorische Unruhe. In der sich anschließenden Trainingsphase wurden die Untersucher an

Videobeispielen unterrichtet, die drei Hauptsymptome einzuschätzen. Am Ende der Schulung

erfolgte die Überprüfung der Interrater-Reliabilität an 5 ausgewählten Videobändern.

Ziel des Trainings war eine möglichst hohe Urteils-Übereinstimmung (Inter-Rater

Reliabilität) der Untersucher auf 6 Items mit vierfach gestuften Likert-Skalen. Die Items,

deren Wortlaut in Tabelle 1 wiedergeben ist, sind den Conners-Skalen entnommen. Den drei

Hauptsymptomen des ADHS/HKS sind jeweils zwei Items zugeordnet.

20

Bitte beschreiben Sie das Kind / den Jugendlichen während der Untersuchung

überhaupt

nicht ein wenig ziemlich sehr stark

War unruhig, zappelig □ □ □ □

Konnte sich schlecht auf die Aufgaben

konzentrieren □ □ □ □

War erregbar, impulsiv □ □ □ □

War leicht ablenkbar □ □ □ □

Redete dazwischen □ □ □ □

Konnte nicht lange stillsitzen □ □ □ □

Tabelle 1: Original-Items, mit denen das Verhalten während der Untersuchung eingeschätzt wird (nach Conners adaptiert)

Die Interviewer benötigten für das Training keine fachspezifischen Vorkenntnisse. Angestrebt

wurde ein Kappa-Wert von über .80, was einer exzellenten Urteilsübereinstimmung

entspricht.

Cohen (1960, 1968) hatte den Kappa-Koeffizienten ursprünglich für die Übereinstimmung

zweier Beurteiler konzipiert, die mehrere Probanden einschätzen. Für nominale Daten wird

der klassische Kappa-Koeffizient angewendet, für ordinale Daten erfolgt die Berechnung der

Urteilsübereinstimmung nach dem gewichteten Kappa (sog. weighted Kappa). Der klassische

Kappa-Koeffizient berechnet sich nach po – pe / 1 – pe, wobei po für die beobachtete

Häufigkeit der jeweiligen Urteilskategorie und pe für die aus den Randverteilungen geschätzte

zufällige Urteilsübereinstimmung steht. Wie der Formel zu entnehmen ist, gibt der Kappa-

Koeffizient darüber Auskunft, wie gut zwei Beurteiler über die zufällige Übereinstimmung

hinaus in ihrem Urteil übereinstimmen. Damit ist der Kappa-Koeffizient ein überaus

konservatives Mass. Wie bereits erwähnt, gelten Kappa-Werte von über .80 in der

sozialwissenschaftlichen Forschung als exzellente Übereinstimmung. Der gewichtete Kappa-

Koeffizient berücksichtigt nicht nur die Urteile, die exakt übereinstimmen, sondern im Falle

unterschiedlicher Einschätzungen auch das Ausmaß der jeweiligen Abweichung. Bei der von

21

uns eingesetzten 4fach gestuften Likert-Skala handelt es sich um ein ordinales Skalenniveau.

Somit ist der gewichtete Kappa-Koeffizient als das angemessene Verfahren für die

Berechnung der Urteilsübereinstimmung anzusehen.

Cohen (1960, 1968) hatte den Kappa-Koeffizienten für die Übereinstimmung von zwei

Beurteilern entwickelt, und bereits auf Möglichkeiten hingewiesen, diesen für mehrere

Urteiler zu erweitern. Der Kappa-Koeffizient für mehrere Urteiler wurde dann von Fleiss

(1971) realisiert. Konsistente Kennwerte des Fleiss’schen Kappa-Koeffizienten sind erst bei

hinreichend vielen Urteilen zu erwarten (z.B. erwartete Zellhäufigkeit von pe >= 5). Im

Rahmen des Untersuchertrainings lagen jedoch Urteile von 8 Untersuchern über 5

exemplarische Videobänder vor. Viele der über die Randverteilungen geschätzten erwarteten

Zellhäufigkeiten hätten in unserem Falle den von Fleiss (1971) vorausgesetzten Kriterien

nicht genügt. Daher entschieden wir uns für ein von Bortz und Koautoren (1997)

favorisiertes, konservatives Vorgehen und berechneten Mittelwerte der klassischen Kappa-

Werte, die sich aus allen möglichen Urteiler-Paaren ergaben. Die Anzahl möglicher

Urteilerpaare bei 8 Untersuchern berechnet sich nach der Formel: 8! / 2! x 6!. Somit ergeben

sich bei 8 Untersuchern 23 Möglichkeiten des Paarvergleichs.

Die Auswahl der Rating-Items und deren Formulierung orientierte sich an bereits für

standardisierte Testsituationen etablierte Beobachtungsverfahren (Swanson 1992), die sich als

reliabel und valide erwiesen haben (Roberts 1990).

Die Antwort-Skala ist in Anlehnung an die beiden ‚Klassiker’ der ADHS-Forschung

(Conners-Skala und die SNAP-IV) vierfach gestuft ( 0 = überhaupt nicht; 1 = ein wenig; 2 =

ziemlich; 3 = sehr stark). Die vierfache Stufung hat auch den Vorteil, einer Antwort-Tendenz

zur Mitte, wie sie bei ungeübten Ratern häufig anzutreffen ist, entgegenzuwirken (Bortz et al.

1995; S.167).

Die Itemformulierungen wurden den international evaluierten Übersetzungen (Huss et al.

2001) der Conners-Skalen entnommen. Die Zuordnung von jeweils 2 Items zu den drei

Hauptsymptomen ist klinisch in höchstem Maße evident. Erwartungsgemäß fiel eine

probeweise Rückzuordnung durch Fachärzte unserer Klinik zu 100% übereinstimmend aus

(leicht ablenkbar; konnte sich schlecht konzentrieren = Aufmerksamkeitsproblem; zappelig;

konnte nicht lange stillsitzen = motorische Unruhe; redet dazwischen; impulsiv =

Impulskontrollstörung).

22

7.2.3 Objektive Verfahren

Mangels hinreichend reliabler und valider objektiver Messverfahren werden in der

ADHS/HKS-Forschung überwiegend subjektive Testverfahren wie Fragebogen oder

Interviews eingesetzt. Dennoch gab es in den vergangenen Jahren erhebliche

Forschungsanstrengungen, auch objektive Messverfahren in der Diagnostik des ADHS zu

etablieren. Dabei hat sich gezeigt, dass sich die drei Hauptsymptome des ADHS/HKS

unterschiedlich gut messen lassen. Bei den Aufmerksamkeits- und Impulskontrollstörungen

haben sich neuropsychologische Verfahren durchgesetzt, die meist auf der Grundlage sog. go-

no-go Paradigmen beruhen. Gemessen werden Fehlerraten und Reaktionszeiten. Dabei haben

sich sog. Auslassungsfehler (omission errors) als indikativ für Aufmerksamkeitsprobleme und

sog. Inhibitionsfehler (comission errors) als indikativ für Impulsivitätsprobleme erwiesen.

Beide Fehler lassen sich mit dem sog. Continuous Performance Test messen. Aufgrund

fehlender Normwerte sowie aufgrund des erheblichen technischen und zeitlichen Aufwandes

konnten diese Verfahren nicht im Hauptsurvey verankert werden.

Bei der objektiven Messung der motorischen Unruhe waren in den vergangenen Jahren

ebenfalls Neuerungen zu verzeichnen. Unsere Arbeitsgruppe (Huss 2003 siehe Anhang) hat in

diesem Zusammenhang ein Doppler-Radar Gerät entwickelt, das sich im klinischen Alltag

bereits seit mehreren Jahren bewährt hat. Mittlerweile wurde von der Charité Berlin in

Zusammenarbeit mit der Investitionsbank Berlin ein internationales Patentverfahren auf den

Weg gebracht. Das Verfahren wurde für den europäischen Innovationspreis der Altran-

Stiftung nominiert und erhielt im Juni 2003 vor der UNESCO in Paris einen der sechs

Finalistenpreise. Im Anhang ist eine Projektskizze wiedergegeben, die das Verfahren und das

Gerät beschreibt.

Für den Einsatz im Rahmen des Gesundheitssurveys bot sich das Radar-Gerät an, da es keine

zusätzliche Untersuchungszeit erforderlich macht, das kindliche Verhalten nicht beeinflusst

und einfach zu bedienen ist.

Das Gerät misst – ähnlich wie der ‚klinische Blick’ - die globalmotorische Unruhe, d.h. alle

Bewegungen der Körperoberfläche werden aufgezeichnet, unabhängig von der Körperpartie

und den dabei beteiligten Muskelgruppen.

Um eine möglichst standardisierte Untersuchungssituation unter gleichen

Anforderungsbedingungen zu gewährleisten, entschieden wir uns, die motorische Unruhe

während des Sehtests im Rahmen des Gesundheitssurveys aufzuzeichnen.

23

Es wurden dafür eigens drei Prototypen bereitgestellt und eine Software (ActoTrace Version

1.0.3) entwickelt, welche die motorische Unruhe mit einer Genauigkeit von 1 ms auf den im

Survey verwendeten Laptops in Echtzeit unter einem 32bit-Betriebssystem aufzeichnet. Im

Rahmen des Trainings am 9. Mai 2003 wurden die Untersucher mit dem Gerät und der

Software vertraut gemacht.

Die Rohdaten werden in anonymisierter Form per e-mail an Herrn Huss geschickt und von

diesem statistisch ausgewertet. Bislang konnten auf diesem Wege bereits 600 Probanden des

Hauptsurveys ausgewertet werden.

Somit werden in Zukunft objektive Daten über die motorische Unruhe der Probanden in

standardisierten Testsituationen zur Verfügung stehen. Wir erhoffen uns davon einen

Zugewinn an Genauigkeit hinsichtlich der Prävalenzbestimmung des ADHS/HKS.

7.2.4 Diagnosealgorithmus auf der Grundlage der im Hauptsurvey implementierten Informationen

Eltern-/Selbsturteil

(Familie)

Lehrerurteil

(Schule)

Untersuchung

(Survey)

Aufmerksamkeit

1)

SDQ: Aufmerksamkeits-

Probleme

2)

nur indirekt über:

Schulnoten

Itemblock Wohlbefinden

in der Schule (insb. Item

über Schulaufgaben)

3)

Rating trainierter

Beobachter

Item 2 + 4

Impulsivität

4)

SDQ: Störungen der

Impulskontrolle

5)

nicht verfügbar

6)

Rating trainierter

Beobachter

Item 3 + 5

motorische Unruhe

7)

SDQ: Hyperaktivität

8)

nicht verfügbar

9)

Rating trainierter

Beobachter

Item 1 + 6

Aktometrie

24

Psychosoziales

Funktionsniveau

(Impact / bzw.

Setting-Kriterium)

10)

Inanspruchnahme von

Hilfe

Wohlbefinden

(Eltern/Kinder/

Jugendliche)

11)

indirekt:

Schulnoten

Klassenwiederholungen

Eltern/Kinder/

Jugendliche:

Wohlbefinden in der

Schule (insb.

Schulaufgaben)

12)

keine Angaben

Zeitkriterium

13)

Elternangaben über

Zeitdauer

14)

keine Angaben

15)

keine Angaben

Tabelle 2: HKS-Diagnosealgorithmus

Für die einzelnen Zellen (siehe Tabelle 2) sind folgende Items verfügbar:

Zelle 1)

Elternfragebogen 3-6 Jahre

Skala Hyperaktivität (Aufmerksamkeits-Items):

• Item 53_15: Leicht ablenkbar (positive Kodierung: 0-1-2)

• Item 53_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne

(negative Kodierung: 2-1-0)

Elternfragebogen 7-10 Jahre

Skala Hyperaktivität (Aufmerksamkeits-Items):

• Item 54_15: Leicht ablenkbar (positive Kodierung: 0-1-2)

• Item 54_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne

(negative Kodierung: 2-1-0)

Elternfragebogen 11-13 Jahre

Skala Hyperaktivität (Aufmerksamkeits-Items):

• Item 46_15: Leicht ablenkbar (positive Kodierung: 0-1-2)

25

• Item 46_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne

(negative Kodierung: 2-1-0)

Kinderfragebogen 11-13 Jahre

Skala Hyperaktivität (Aufmerksamkeits-Items):

• Item 16_15: Leicht ablenkbar (positive Kodierung: 0-1-2)

• Item 16_25: Was ich angefangen habe, macht ich zu Ende, ich kann mich lange genug

konzentrieren (negative Kodierung: 2-1-0)

CAVE: in der uns vorliegenden Fragebogenversion für Kinder 11-13 Jahre wurde

fälschlicherweise die Reihenfolge der SDQ-Items 24 und 25 vertauscht.

Elternfragebogen 14-17 Jahre

Skala Hyperaktivität (Aufmerksamkeits-Items):

• Item 46_15: Leicht ablenkbar (positive Kodierung: 0-1-2)

• Item 46_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne

(negative Kodierung: 2-1-0)

Jugendfragebogen 14-17 Jahre

Skala Hyperaktivität (Aufmerksamkeits-Items):

• Item 37_15: Leicht ablenkbar (positive Kodierung: 0-1-2)

• Item 37_25: Führt Aufgaben zu Ende, gute Konzentrationsspanne

(negative Kodierung: 2-1-0)

CAVE: in der uns vorliegenden Fragebogenversion für Jugendliche 14-17 Jahre wurde

fälschlicherweise die Reihenfolge der SDQ-Items 24 und 25 vertauscht.

Zelle 2)

Es liegen keine direkten Lehrerurteile über das Verhalten der Schüler vor.

Indirekt kann eine orientierende Aussage über Aufmerksamkeitsprobleme mittels der

Schulnoten (Mathematik- und Deutschnote) getroffen werden: Wenn sich in den Schulnoten

keine Leistungsprobleme abzeichnen, liegt keine schwerwiegende Aufmerksamkeitsstörung

vor. Umgekehrt kann allerdings aus dem Vorliegen von Schulleistungsproblemen nicht auf

Aufmerksamkeitsstörungen geschlossen werden, da diese vielfältige Ursachen haben können.

26

Orientierend können auch die Angaben der Eltern über das Wohlbefinden der Kinder und

Jugendliche in der Schule herangezogen werden. Hierbei ist insbesondere das Item ‚In der

letzten Woche hat mein Kind die Schulaufgaben gut geschafft (nie – selten – manchmal – oft

– immer)’ von Bedeutung.

Zelle 3)

Hinweise auf Aufmerksamkeitsprobleme während der Untersuchung werden von den

trainierten Untersuchern auf der in Kapitel 7.2.2 beschriebenen adaptierten Conners-Skala

eingeschätzt.

Folgende Items beziehen sich auf Aufmerksamkeitsprobleme:

Item 2: Konnte sich auf die Aufgaben schlecht konzentrieren

0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark

Item 4: War leicht ablenkbar

0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark

Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist,

wurden bei dem Reliabilitätstest für die Aufmerksamkeits-Items mit Kappa = .62 bzw.

weigthed Kappa = .91 sehr gute Urteilsübereinstimmungen erzielt.

Zelle 4)

Elternfragebogen 3-6 Jahre

Skala Hyperaktivität (Impulsivitäts-Item):

• Item 53_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)

Elternfragebogen 7-10 Jahre

Skala Hyperaktivität (Impulsivitäts-Item):

• Item 54_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)

Elternfragebogen 11-13 Jahre

Skala Hyperaktivität (Impulsivitäts-Item):

27

• Item 46_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)

Kinderfragebogen 11-13 Jahre

Skala Hyperaktivität (Impulsivitäts-Item):

• Item 16_21: Ich denke nach, bevor ich handle (negative Kodierung: 2-1-0)

Elternfragebogen 14-17 Jahre

Skala Hyperaktivität (Impulsivitäts-Item):

• Item 46_21: Denkt nach, bevor er/sie handelt (negative Kodierung: 2-1-0)

Jugendfragebogen 14-17 Jahre

Skala Hyperaktivität (Impulsivitäts-Item):

• Item 37_21: Ich denke nach, bevor ich handle (negative Kodierung: 2-1-0)

Zelle 5)

Es liegen keine Lehrerinformationen über impulsives Verhalten in der Schule/ dem

Kinderhort vor. Darüber hinaus ergeben sich aus dem vorliegenden Datenmaterial keine

Möglichkeiten, impulsives Verhalten in der Schule /dem Hort abzuschätzen.

Zelle 6)

Hinweise auf Probleme der Impulskontrolle während der Untersuchung werden von den

trainierten Untersuchern auf der in Kapitel 7.2.2 beschriebenen adaptierten Conners-Skala

eingeschätzt.

Folgende Items beziehen sich auf Probleme der Impulskontrolle:

Item 3: War erregbar, impulsiv

0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark

Item 5: Redete dazwischen

0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark

28

Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist,

wurden bei dem Reliabilitätstest für die Impulsivitäts-Items mit Kappa = .63 bzw. weigthed

Kappa = .93 sehr gute Urteilsübereinstimmungen erzielt.

Zelle 7)

Elternfragebogen 3-6 Jahre

Skala Hyperaktivität:

• Item 53_2: Unruhig, überaktiv, kann nicht lange stillsitzen

(positive Kodierung: 0-1-2)

• Item 53_10: Ständig zappelig (positive Kodierung: 0-1-2)

Elternfragebogen 7-10 Jahre

Skala Hyperaktivität:

• Item 54_2: Unruhig, überaktiv, kann nicht lange stillsitzen

(positive Kodierung: 0-1-2)

• Item 54_10: Ständig zappelig (positive Kodierung: 0-1-2)

Elternfragebogen 11-13 Jahre

Skala Hyperaktivität:

• Item 46_2: Unruhig, überaktiv, kann nicht lange stillsitzen

(positive Kodierung: 0-1-2)

• Item 46_10: Ständig zappelig (positive Kodierung: 0-1-2)

Kinderfragebogen 11-13 Jahre

Skala Hyperaktivität:

• Item 16_2: Ich bin oft unruhig, ich kann nicht lange stillsitzen

(positive Kodierung: 0-1-2)

• Item 16_10: Ich bin dauernd in Bewegung und zappelig (positive Kodierung: 0-1-2)

Elternfragebogen 14-17 Jahre

Skala Hyperaktivität:

• Item 46_2: Unruhig, überaktiv, kann nicht lange stillsitzen

29

(positive Kodierung: 0-1-2)

• Item 46_10: Ständig zappelig (positive Kodierung: 0-1-2)

Jugendfragebogen 14-17 Jahre

Skala Hyperaktivität:

• Item 37_2: Ich bin oft unruhig, ich kann nicht lange stillsitzen

(positive Kodierung: 0-1-2)

• Item 37_10: Ich bin dauernd in Bewegung und zappelig (positive Kodierung: 0-1-2)

Zelle 8)

Es liegen keine Lehrerinformationen über motorische Unruhe in der Schule/ dem Kinderhort

vor. Darüber hinaus ergeben sich aus dem vorliegenden Datenmaterial keine Möglichkeiten,

die motorische Unruhe in der Schule /dem Hort abzuschätzen.

Zelle 9)

Hinweise auf motorische Unruhe während der Untersuchung werden von den trainierten

Untersuchern auf der in Kapitel 7.3 beschriebenen adaptierten Conners-Skala eingeschätzt.

Folgende Items beziehen sich auf die motorische Unruhe:

Item 1: War unruhig, zappelig

0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark

Item 6: Konnte nicht lange stillsitzen

0 = überhaupt nicht – 1 = ein wenig – 2 = ziemlich – 3 = sehr stark

Wie dem Kapitel über die Ergebnisse des Untersuchertrainings (Kapitel 10) zu entnehmen ist,

wurden bei dem Reliabilitätstest für die Hyperaktivitäts-Items mit Kappa = .54 bzw. weigthed

Kappa = .88 gute Urteilsübereinstimmungen erzielt.

Zusätzlich wird die motorische Unruhe objektiv mittels Radar-Aktometrie während einer

standardisierten Untersuchungssituation (Sehtest) erfasst. Da bislang zu dem im Survey

eingesetzten Untersuchungs-Setting keine Normwerte vorliegen, wird die Extremgruppe mit

30

überdurchschnittlich hohen Hyperaktivitätswerten anhand der Verteilung der

Gesamtstichprobe (>= 95. Perzentile) ermittelt.

Zelle 10)

Elternfragebogen 3-6 Jahre:

Frage 27_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für

die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein

Fragenblock zum Wohlbefinden: Block 47 ‚Seelisches Wohlbefinden’; Block 48 ‚Selbstwert’;

Block 49 ‚Familie’; Block 50 ‚Freunde’

Elternfragebogen 7-10 Jahre:

Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für

die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein

Fragenblock zum Wohlbefinden: Block 48 ‚Seelisches Wohlbefinden’; Block 49 ‚Selbstwert’;

Block 50 ‚Familie’; Block 51 ‚Freunde’

Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens

Elternfragebogen 11-13 Jahre:

Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für

die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein

Fragenblock zum Wohlbefinden: Block 40 ‚Seelisches Wohlbefinden’; Block 41 ‚Selbstwert’;

Block 42 ‚Familie’; Block 43 ‚Freunde’

Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens

Kinderfragebogen 11-13 Jahre:

Fragenblock zum Wohlbefinden: Block 10 ‚Seelisches Wohlbefinden’; Block 11 ‚Selbstwert’;

Block 12 ‚Familie’; Block 13 ‚Freunde’

Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens

Elternfragebogen 14-17 Jahre:

Frage 28_13: Hat Ihr Kind emotionale, entwicklungs- oder verhaltensbezogene Probleme, für

die es Behandlung bzw. Beratung benötigt oder bekommt? ja/nein

31

Fragenblock zum Wohlbefinden: Block 40 ‚Seelisches Wohlbefinden’; Block 41 ‚Selbstwert’;

Block 42 ‚Familie’; Block 43 ‚Freunde’

Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens

Jugendlichenfragebogen 14-17 Jahre:

Fragenblock zum Wohlbefinden: Block 31 ‚Seelisches Wohlbefinden’; Block 32 ‚Selbstwert’;

Block 33 ‚Familie’; Block 34 ‚Freunde’

Auswertung analog eines ‚Impact-Scores’ gemäß Vorgaben des Originalfragebogens

Zelle 11)

Es liegen keine direkten Lehrerurteile über Auswirkungen des ADHS auf die Schulleistung

bzw. das Verhalten der Schüler und deren sozialer Integration vor.

Ähnlich wie bereits für die Aufmerksamkeitsstörungen, kann eine indirekte Einschätzung des

Leistungsniveaus durch die Schulnoten (Mathematik- und Deutschnote) vorgenommen

werden. Zusätzlich ergeben sich Indikatoren aus Klassenwiederholungen. Die Interpretation

muss erneut sehr zurückhaltend erfolgen. Wenn sich in den Schulnoten keine

Leistungsprobleme abzeichnen bzw. keine Klassenwiederholungen erfolgt sind, liegen keine

schwerwiegenden Einschränkungen des Funktionsniveaus im schulischen Bereich vor. In der

Regel gehen schwere ADHS/HKS-Verhaltensauffälligkeiten mit Einschränkungen der

schulischen Leistungsfähigkeit – häufig auch mit Klassenwiederholungen - einher.

Orientierend können auch die Angaben der Eltern über das Wohlbefinden der Kinder und

Jugendliche in der Schule herangezogen werden. Hierbei ist insbesondere das Item ‚In der

letzten Woche hat mein Kind die Schulaufgaben gut geschafft (nie – selten – manchmal – oft

– immer)’ von Bedeutung.

Elternfragebogen 7-10 Jahre

• Frage 61: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt.

• Frage 62: Falls noch keine Noten vergeben werden -> Einschätzung der

Schulleistungen durch die Eltern in

ungenügend – unterdurchschnittlich – durchschnittlich - überdurchschnittlich

• Frage 62: Falls Noten vergeben wurden:

Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis in..?

32

… Mathematik

… Deutsch

Elternfragebogen 11-13 Jahre

• Frage 53: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt.

• Frage 54: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis

in..?

… Mathematik

… Deutsch

Elternfragebogen 14-17 Jahre

• Frage 53: Seit dem Schuleintritt hat mein Kind eine/mehrere Klassen wiederholt.

• Frage 54: Welche Note bzw. welche Punktzahl hat Ihr Kind auf dem letzten Zeugnis

in..?

… Mathematik

… Deutsch

Die indirekten Informationen über die Schule (Schulnoten; Klassenwiederholungen;

Wohlbefinden bezogen auf die Schule) sind zu unspezifisch als dass sie mit hinreichender

Sicherheit einer der Zellen 2, 5, 8, 11 oder 14 zugeordnet werden könnten. Die beste

Zuordnung ist für die Zellen 2 und 11 zu erwarten. Für den Diagnosealgorithmus schlagen wir

daher eine Zuordnung zu beiden Zellen mit entsprechend niedriger Gewichtung vor.

Zelle 12)

Die Untersucher erheben keine Daten über das psychosoziale Funktionsniveau im schulischen

Bereich.

Zelle 13)

Elternfragebogen 3-6 Jahre

• Frage 27_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von

mindestens 12 Monaten zu erwarten? ja/nein

33

(Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder

Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)

Elternfragebogen 7-10 Jahre

• Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von

mindestens 12 Monaten zu erwarten? ja/nein

(Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder

Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)

Elternfragebogen 11-13 Jahre

• Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von

mindestens 12 Monaten zu erwarten? ja/nein

(Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder

Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)

Elternfragebogen 14-17 Jahre

• Frage 28_15: Dauerte dieses Problem bereits 12 Monate an oder ist eine Dauer von

mindestens 12 Monaten zu erwarten? ja/nein

(Bezug: Frage 29_13: Hat Ihr Kind emotionale, Entwicklungs- oder

Verhaltensprobleme, für die es Behandlung bzw. Beratung benötigt oder bekommt?)

Zelle 14)

Es liegen keine Angaben der Lehrer über den Zeitverlauf von Lern- und

Verhaltensauffälligkeiten vor.

Zelle 15)

Die Untersucher erheben keine Daten über den Zeitverlauf einer eventuellen

Verhaltensauffälligkeit.

34

8 SDQ-Ergebnisse aus dem Pretest

Für die hier vorgelegte Auswertung der Pretest-Daten erhielten wir vom Robert-Koch-Institut

einen SDQ-Datensatz von ursprünglich n = 1.626 Kindern und Jugendlichen. 207 Fälle

enthielten keine Daten (als missing data deklariert). Bei 55 Fällen fehlten die Angaben zu

mehr als einem Item und wurden daher aus Gründen eines konservativen Vorgehens von der

Analyse ausgeschlossen. Es resultiert somit ein verwertbarer Datensatz von n = 1.364 Fällen.

Die Geschlechtsverteilung beträgt 685 (50,2%) Jungen zu 679 (49,8%) Mädchen. Der

Altersmittelwert liegt bei 11,31 Jahren mit einer Standardabweichung von 3,94 Jahren.

Parallel dazu wurden in unserer Klinik im Zeitraum vom 16. Januar 2001 bis zum 16. Juli

2003 eine Stichprobe von n = 1.221 Kindern und Jugendlichen mittels des SDQ erhoben. Bei

der Geschlechtsverteilung überwiegen – wie in kinderpsychiatrischen Inanspruchnahme-

populationen üblich - die Jungen mit n = 827 (67,7%) gegenüber den Mädchen mit n = 394

(32,3%). Der Altersmittelwert der Klinikstichprobe liegt bei 10,56 Jahren mit einer

Standardabweichung von 3,42 Jahren.

Die Auswertung der SDQ-Daten erfolgt nach den Vorgaben von Prof. Robert Goodman

(www.sdqinfo.com). Wie der SPSS-Steuerdatei im Anhang zu entnehmen ist, werden 5

Skalen gebildet, in die jeweils 5 Items eingehen.

Die 5 Skalen sind inhaltlich charakterisiert als: 1) Emotionale Probleme, 2) Aufmerksamkeits-

Defizit-Hyperaktivitäts Probleme, 3) Betragensprobleme, 4) Probleme mit Peers und 5)

Prosoziales Verhalten. Die Summe der vier erstgenannten Skalen bildet den sog. Problem-

Score, der als allgemeiner Index für psychische Auffälligkeiten gewertet wird. Die Skala

‚Prosoziales Verhalten’ erfragt explizit positive Ressourcen der Kinder und geht damit nicht

in die Berechnung psychischer Auffälligkeiten ein. Üblicherweise fallen die Werte für

prosoziales Verhalten in Klinikstichproben gegenüber einer Feldstichprobe niedriger aus.

Bei der Konstruktion des Fragebogens ging Robert Goodman auch bei manchen Problem-

Items ressourcen-orientiert vor. Dies bedeutet, dass manche Fragen positiv umformuliert

wurden und bei der Auswertung der Problem-Skalen gegensinnig kodiert werden müssen.

Beispielsweise wird in der Skala der Aufmerksamkeitsstörungen mit Item 25 erfragt, ob das

Kind Aufgaben zu Ende führen kann. Wird die Frage von den Eltern verneint, so wird diese

Angabe mit positivem Itemwert in der Skala verrechnet. Die genaue Konstruktion der Skalen

und ihrer Umkodierungen sind dem Steuerfile im Anhang zu entnehmen.

35

In der Einleitung des Forschungsberichts wurde bereits darauf hingewiesen, dass die

Ausprägung von Symptomen noch keine hinreichende Aussage über das Vorliegen einer

Erkrankung bzw. psychischen Störung erlaubt. Insbesondere bei dem hier zu untersuchenden

ADHS/HKS muss zusätzlich eine Beeinträchtigung des psychosozialen Funktionsniveaus

vorliegen. Wie in Kapitel 7 erläutert, muss darüber hinaus noch die Dauer der Symptome

mindestens 6 Monate betragen.

In der Klinikstichprobe lassen sich die Beeinträchtigung des psychosozialen Funktionsniveau

wie auch die Zeitdauer der Probleme sehr gut aus dem Impact-Teil ableiten. Wie dem

Original-Fragebogen im Anhang zu entnehmen ist, wird erfragt, ob sich aus den

beschriebenen Symptomen Probleme im Alltagsleben – gegliedert nach Familie, Schule,

Freizeit und Umgang mit Gleichaltrigen – ergeben. Die Zeitdauer wird stratifiziert erfasst (0 =

weniger als 1 Monat; 1 = 1 bis 5 Monate; 2 = 6 – 12 Monate; 3 = über ein Jahr).

Die genaue Berechnung des sog. Impact-Scores, der Zeitangaben sowie der Auswirkungen

auf das Alltagsleben können dem SPSS-Steuerfile im Anhang entnommen werden.

Goodman und Mitarbeiter (2000) haben auf der Grundlage des britischen Surveys

Schwellenwerte (cut-off-values) gebildet, die sich an den Perzentilen der repräsentativen

britischen Stichprobe orientieren. Die Schwellenwerte wurden so gewählt, dass etwa 80% der

Kinder als unauffällig, 10% der Kinder als grenzwertig auffällig und 10% der Kinder als

auffällig klassifiziert werden. Wörner et al. (2002) hat diese Schwellenwerte für Deutschland

weitgehend replizieren können.

Die von Goodman (www.sdqinfo.com) ermittelten Schwellenwerte sind nachfolgender

Tabelle zu entnehmen.

Normal Grenzwertig Auffällig Gesamtproblemwert 0-13 14-16 17-40

Emotionale Probleme 0-3 4 5-10

Verhaltensprobleme 0-2 3 4-10

Hyperaktivität 0-5 6 7-10

Probleme mit Peers 0-2 3 4-10

Prosoziales Verhalten 6-10 5 0-4

Impact-Skala 0 1 2-10

Tabelle 3: Schwellenwerte der SDQ-Skalen nach Goodman (www.sdqinfo.com)

36

Da die Rohwerte (z.B. für Zappeln, Dazwischenreden etc.) alters- und geschlechtsabhängig

sind, wurde bei der T-Wert-Berechnung bekannter internationaler Screening-Instrumente

(z.B. Child Behavior Checklist, Conners-Skalen) eine Alters- und Geschlechtsstratifizierung

vorgenommen. Umso verwunderlicher ist es, dass bei den cut-off-values von Robert

Goodman weder Geschlechts- noch Alterseffekte berücksichtigt wurden. Gemäß dieser

Vorgabe gilt ein dreijähriger Junge als ebenso auffällig, wenn er Rohwertpunkte über 6 auf

der Hyperaktivitätsskala aufweist, wie ein 17jähriges Mädchen.

Wir gehen davon aus, dass die SDQ-Daten des Hauptsurveys die Schwächen dieses

Verfahrens aufweisen und als Grundlage dienen werden, alters- und geschlechtsstratifizierte

cut-off-values für die Bundesrepublik zu erstellen.

Die nachfolgende Graphik einer orientierenden Analyse (Ordinate = Mittelwert mit 95%igem

Konfidenzintervall der Rohwerte aus der Hyperaktivitätsskala; Abzisse = Alter der Kinder)

der uns vorliegenden SDQ-Daten aus der Klinik und aus dem Pretest des RKI bestätigt, dass

mit Alters- und insbesondere mit Geschlechtseffekten zu rechnen ist.

37

Alter

1716

1514

1312

1110

98

76

54

HK

S-S

kale

nwer

t mit

95%

Kon

fiden

zint

erva

ll10

8

6

4

2

0

RKI Jungen

RKI Mädchen

Charite Jungen

Charite Mädchen

Abbildung 1: Altersverteilung der HKS-Rohwerte gegliedert nach Geschlecht und Stichprobe

Da die Repräsentativität der Pretest-Daten nicht belegt ist, verzichten wir auf eine deutsche

Adaptation der cut-off-values und übernehmen die von Goodman veröffentlichten Werte. Im

Rahmen der Prävalenzschätzung mit den Daten des Hauptsurveys sollte allerdings eine

entsprechende Adjustierung insbesondere für das Geschlecht durchgeführt werden.

Wie bereits erwähnt, wurde der SDQ im Pretest wie auch im Hauptsurvey aus

zeitökonomischen Gründen ohne Impact-Teil eingesetzt. Damit entfällt die Möglichkeit, den

38

Impact-Score und das Zeitkriterium in die Analysen direkt einzubeziehen. Für die hier

vorzunehmende Prävalenzbestimmung sind wir daher auf konservative Schätzverfahren

angewiesen.

Für den Umgang mit fehlenden SDQ-Daten über das psychosoziale Funktionsniveau sowie

der Zeitdauer der Symptome wurden folgend methodische Vorüberlegungen angestellt:

A) Ein erster methodischer Zugang zu dem Problem fehlender Impact-Daten im

Pretest und Hauptsurvey besteht darin, das psychosoziale Funktionsniveau und

die Zeitdauer der Symptome bei der Prävalenzbestimmung nicht zu

berücksichtigen. Die SDQ-Analysen müssten sich dann auf die

Symptomausprägung beschränken. Wie bereits ausgeführt, definiert sich

ADHS/HKS aber nicht nur auf der Grundlage von Symptomen, sondern auch aus

deren Dauer und ihren Auswirkungen auf das Alltagsleben des Kindes. Wie bei

Wolraich et al. (1998) gezeigt werden konnte, ist bei einer Analyse, die sich nur

auf Symptome bezieht, mit einer deutlichen Überschätzung der Prävalenz zu

rechnen. Wir entschieden uns daher, nicht auf das psychosoziale Funktionsniveau

und die Zeitdauer zu verzichten, sondern diese aus der parallel erhobenen

Klinikstichprobe zu schätzen.

B) Patienten einer kinderpsychiatrischen Klinik zeigen erwartungsgemäß höhere

Symptomausprägungen als Kinder einer unausgelesenen Feldstichprobe. Die

genauen Werte werden nachfolgend aufgeführt. Die zu ewartende Prävalenz von

ADHS/HKS ist in der Klinik um ein Vielfaches (Faktor 10 bis 15) höher als in

einer unausgelesenen Feldstichprobe. Dennoch finden sich in der Klinik eine

Reihe von Kinder, die hohe Symptomausprägungen haben, ohne jedoch das

Kriterium der Zeitdauer (mind. 6 Monate) oder das Kriterium ‚Leidensdruck’ zu

erfüllen. Eine ADHS-Diagnose wäre somit bei diesen Kindern nicht

gerechtfertigt.

Da die Klinikpatienten aufgrund meist schwerwiegender Probleme bei uns

vorgestellt werden, ist davon auszugehen, dass der Anteil der hohen

Symptomträger mit niedrigem Leidensdruck bzw. kurzzeitiger

Symptomausprägung gering ausfällt. Nimmt man diese Rate als Schätzwert für

eine Feldstichprobe, unterschätzt man die Anzahl der Symptomträger ohne

39

Leidensdruck im Feld. Mit anderen Worten: bezogen auf unsere Forschungsfrage

wird ein konservativer Fehler begangen.

Die Rohwertevergleiche für alle SDQ-Skalen einschließlich des sog. Total-Problem-

Score sind Tabelle 4 zu entnehmen.

Deskriptivstatistik Pretest(RKI)- und Klinik(Charite)- Skalen des SDQ

Emotionale Probleme

Verhaltens-probleme

ADHS/ HKS

Probleme mit Peers

Prosoziales Verhalten TOTAL

Mittelwert 1,85 2,06 3,22 1,57 7,68 8,69N 1364 1364 1364 1364 1364 1364RKI Standardabweichung 1,82 1,63 2,27 1,66 1,70 5,30Mittelwert 3,72 3,32 5,89 3,06 6,89 16,00N 1221 1221 1221 1221 1221 1221Charite Standardabweichung 2,56 2,34 2,86 2,42 2,21 6,78Mittelwert 2,74 2,66 4,48 2,27 7,31 12,14N 2585 2585 2585 2585 2585 2585Insgesamt Standardabweichung 2,39 2,09 2,89 2,18 2,00 7,06

Tabelle 4: Deskritpivstatistik der SDQ-Skalen gegliedert nach Stichprobe

Die graphische Darstellung des Gruppenvergleichs mit Skalenmittelwerten und 95%igem

Konfidenzintervall ist nachfolgend wiedergegeben. Erwartungsgemäß finden sich in allen

Problem-Skalen und dem Total-Score signifikant höhere Rohwerte in der

Klinikstichprobe. Die Skala für prosoziales Verhalten fällt für die Klinikstichprobe –

ebenfalls erwartungskonform – signifikant niedriger aus.

40

ChariteRKI

Skal

enw

ert m

it 95

% K

onfid

enzi

nter

vall

20

10

0

Emotionale

Probleme

Verhaltens-

probleme

ADHS/HKS

Probleme

mit Peers

Prosoziales

Verhalten

total

Abbildung 2: Skalenmittelwerte mit 95%igem Konfidenzintervall gegliedert nach Stichprobe

Wie dem F-Wert von 702,3 in der nachfolgenden Tabelle zu entnehmen ist, fällt der

Stichprobeneffekt für den Bereich der hyperkinetischen Störungen (ADHS/HKS)

besonders deutlich aus.

41

Varianzanalytischer Vergleich (ANOVA) zwischen Pretest- und Klinik-Daten bezogen auf die SDQ-Skalen

Quadratsumme Df Mittel der

Quadrate F Signifikanz

Zwischen den Gruppen (Kombiniert) 2244,807 1 2244,807 463,284 ,000

Innerhalb der Gruppen 12515,733 2583 4,845 Emotionale Probleme

Insgesamt 14760,540 2584 Zwischen den Gruppen (Kombiniert) 1034,331 1 1034,331 259,088 ,000

Innerhalb der Gruppen 10311,869 2583 3,992 Betragens-probleme

Insgesamt 11346,200 2584 Zwischen den Gruppen (Kombiniert) 4612,000 1 4612,000 702,275 ,000

Innerhalb der Gruppen 16963,143 2583 6,567 Hyperkinetische Störung

Insgesamt 21575,143 2584 Zwischen den Gruppen (Kombiniert) 1447,137 1 1447,137 343,532 ,000

Innerhalb der Gruppen 10880,950 2583 4,213 Probleme mit Gleichaltrigen

Insgesamt 12328,087 2584 Zwischen den Gruppen (Kombiniert) 410,218 1 410,218 107,017 ,000

Innerhalb der Gruppen 9901,126 2583 3,833 Prosoziales Verhalten

Insgesamt 10311,345 2584 Zwischen den Gruppen (Kombiniert) 34407,792 1 34407,792 941,868 ,000

Innerhalb der Gruppen 94360,674 2583 36,531

Gesamtwert psychischer Auffälligkeiten

Insgesamt 128768,467 2584

Tabelle 5: Varianzanalytischer Vergleich der Skalenwerte zwischen den Stichproben

Da das Geschlechtsverhältnis in den beiden Stichproben unterschiedlich ist und sowohl die

Prävalenz als auch die Symptomausprägung zwischen Jungen und Mädchen unterschiedlich

ist, muss bei den oben dargestellten Ergebnissen noch kontrolliert werden, ob der

Stichprobeneffekt mit dem Geschlechtseffekten konfundiert ist. Zu diesem Zweck wurde ein

linares Modell gerechnet, in dem als abhängige Variable die Rohdaten der SDQ-Skala ‚HKS’

und als Prädiktoren sowohl die Stichprobenzugehörigkeit als auch das Geschlecht

eingegangen sind.

Dabei zeigte sich, dass die Stichprobenzugehörigkeit auch nach der Kontrolle des

Geschlechtseffektes weiterhin der Prädiktor mit der höchsten Vorhersagekraft bleibt

(partielles Eta-Quadrat als Mass für die von dem Prädiktor erklärte Varianz = 0,176). Als

zweiter Haupteffekt erwies sich erwartungskonform das Geschlecht (partielles Eta-Quadrat =

0,075). Der Interaktioneffekt zwischen Stichprobe und Geschlecht war zu vernachlässigen

(partielles Eta-Quadrat = 0,004). Somit lässt sich der Gesamteffekt nicht auf unterschiedliche

Geschlechtsverteilungen zwischen der RKI- und der Klinikstichprobe zurückführen.

42

9 Ergebnisse des Reliabilitäts-Training für den Hauptsurvey

Wie in Kapitel 7.2.2 erläutert, wurden die 8 Untersucher des Hauptsurveys einem

Videotraining mit anschließender Reliabilitätsprüfung unterzogen. Die Reliabilität wurde für

5 exemplarisch ausgewählte Fälle berechnet. Jeder Untersucher musste sich pro Kind bei 6

Items jeweils auf einer 4fach gestuften Likert-Skala festlegen.

Somit stehen für die Reliabilitätsprüfung insgesamt 240 Urteile (8 Untersucher x 6 Items x 5

Kinder) zur Verfügung. Wie in Kapitel 7.2.2 weiterhin ausgeführt, erfolgte die Berechnung

sowohl nach dem ungewichteten als auch nach dem gewichteten Kappa. Angestrebt wurde ein

Kappa-Wert von über .80.

Die Antwortmuster - 0 = überhaupt nicht; 1 = ein wenig; 2 = ziemlich; 3 = sehr stark –

werden als Ordinalskala aufgefasst (0<1<2<3). Wie bereits erläutert, muss bei dem

gewichteten Kappa a priori eine Gewichtung festgelegt werden, die das jeweils abweichende

Urteilsverhalten eines Untersuchers in Relation zu den anderen Urteilern ‚bestraft’. Da die

vorgegebene Likert-Skala häufig in der sozialwissenschaftlichen Forschung als quasi-

metrisch verstanden wird, erschien eine lineare Gewichtung als angemessen. Dabei wird der

exakten Übereinstimmung zwischen zwei Urteilern das Gewicht Null (keine Bestrafung) und

der maximalen Abweichung der Wert Eins (maximale Bestrafung) zugeordnet. Die beiden

Zwischenwerte erhalten das Gewicht 1/3 bzw. 2/3.

Tabelle 6 stellt die Gewichtung im Überblick dar.

Urteiler X

über

haup

t nic

ht

ein

wen

ig

ziem

lich

sehr

sta

rk

überhaupt nicht 0,00 0,33 0,67 1,00 ein wenig 0,33 0,00 0,33 0,67 ziemlich 0,67 0,33 0,00 0,33

Urte

iler Y

sehr stark 1,00 0,67 0,33 0,00

Tabelle 6: Kappa-Gewichte für die Berechnung der ordinalen Urteilsübereinstimmung

43

Da SPSS nur eine sehr unflexible Routine der klassischen Kappa-Berechnung zur Verfügung

stellt und weder eine Gewichtung zulässt noch die Erweiterung nach Fleiss beinhaltet,

entschlossen wir uns, eine eigene Routine unter Excel zu programmieren, die alle

erforderlichen Erweiterungen der Kappa-Berechnung auf nominalem und ordinalen

Datenniveau beinhaltet. Die hier mitgeteilten Werte wurden mit dieser Excel-Routine

berechnet.

Als Gesamtergebnis ergab sich bei der Berechnung auf nominalem Datenniveau ein Kappa-

Wert nach Fleiss von 0,60. Berücksichtigt man, dass es sich dabei um einen von zufälligen

Übereinstimmungen bereinigten Wert handelt, so kann von einer akzeptablen

Übereinstimmung ausgegangen werden. Dennoch wurde das Ziel des Trainings (Kappa >=

.80) für die nominale Berechnung nicht erreicht.

Wie bereits in den theoretischen Ausführungen über das Kappa-Maß erläutert, erscheint der

gewichtete Kappa-Koeffizient für unsere Forschungsfrage als angemessener. Mit der oben

genannten Gewichtungsmatrix erzielten die Untersucher ein Gesamt-Kappa von .90, was als

exzellentes Ergebnis anzusehen ist. Der deutliche Zugewinn an Übereinstimmung bei der

Berechung auf ordinalen Datenniveau resultiert im Wesentlichen aus der Tatsache, dass in

keinem Paarvergleich mehr als zwei Antwortkategorien abgewichen wurde. Mit anderen

Worten: in keinem der 23 Paarvergleiche über 6 Items hinweg wurde jemals die maximale

Abweichung von 3 Antwortkategorien realisiert.

Da das Ausmaß der Abweichung bei dem nominalen Kappa nicht berücksichtigt wird, kommt

es formal zu erheblich schlechteren Übereinstimmungsmaßen, die jedoch die faktisch hohe

Übereinstimmung nur unzureichend spiegelt.

Die Urteilskategorien decken mit den 6 Items die drei Hauptsymptome von ADHS/HKS ab.

Damit ist es möglich, die Übereinstimmungen auf Symptom-Ebene zu überprüfen.

Tabelle 7 zeigt beide Kappa-Koeffizienten differenziert nach den Items, den drei

Hauptsymptomen und den Gesamt-Koeffizienten.

44

Es werden jeweils nur die ersten beiden Stellen hinter dem Komma dargestellt

Kap

pa n

ach

Flei

ss

Wei

ghte

d K

appa

1) War unruhig, zappelig 0,55 0,88

2) Konnte sich schlecht auf die Aufgaben konzentrieren 0,57 0,89

3) War erregt, impulsiv 0,60 0,92

4) War leicht ablenkbar 0,67 0,92

5) Redete dazwischen 0,65 0,93

6) Konnte nicht lange stillsitzen 0,53 0,87

Mittelwert Aufmerksamkeitsprobleme 2) + 4) 0,62 0,91

Mittelwert Impulskontrollstörung 3) + 5) 0,63 0,93

Mittelwert Motorische Unruhe 1) + 6) 0,54 0,88

Gesamt-Mittelwert: 0,60 0,90

Tabelle 7: Kappa-Ergebnisse des Reliabilitätstests gegliedert nach Items, Skalen und Gesamt-Mittelwert

Die Daten überraschen zunächst, da die motorische Unruhe, von der häufig angenommen

wird, dass sie am einfachsten ohne fachliche Vorkenntnisse zu beurteilen sei, die

schlechtesten Übereinstimmungen aufweist. Diese Ergebnisse decken sich jedoch mit der

klinischen Erfahrung, der zu Folge auch versierte Therapeuten besondere Schwierigkeiten

haben, die motorische Unruhe reliabel zu quantifizieren.

Diese Erfahrung hat uns vor Jahren dazu bewogen, eine reliable und valide Methode zur

objektiven Quantifizierung motorischer Unruhe zu entwickeln.

Durch den Einsatz des Radar-Aktometers kann diese Lücke nun geschlossen werden.

45

10 Welche vorläufigen Prävalenzschätzungen ergeben sich aus den bisher verfügbaren Daten des Pretests?

Die hier vorgenommene, vorläufige Prävalenzschätzung für ADHS beruht auf den

verfügbaren SDQ-Daten des Pretests und der Klinikstichprobe.

Unter Berücksichtigung der Vorläufigkeit der Ergebnisse werden folgende (überwiegend

nicht belegte, bzw. aus der Literatur oder der Klinikstichprobe approximierte) Annahmen

gemacht:

A) Der Pretest stellt eine grobe Näherung der zu erwartenden repräsentativen Survey-

Daten dar (nicht belegte Annahme).

B) Die Eltern-Einschätzungen auf der SDQ-Skala für Hyperaktivität stellen eine

Näherung des ADHS-Diagnose dar (Positiver prädikativer Wert für Hyperkinetische

Störungen nach ICD-10 = 63,5% gemäß Goodman et al. 2000).

C) Das Elternurteil approximiert die im Rahmen der ADHS-Diagnostik geforderte

Urteilskonvergenz zwischen Eltern, Lehrer und Untersucher (Goodman et al. 2000).

D) Die von Robert Goodman veröffentlichten Schwellenwerte lassen sich auf deutsche

Verhältnisse übertragen (Wörner et al. 2002).

E) Das Verhältnis von Symptomausprägung und daraus resultierendem Leidensdruck ist

in der Pretest-Stichprobe maximal so groß wie in der Klinikstichprobe (theoretische

Überlegung).

F) Die Symptomdauer ist in der Feldstichprobe maximal so lang wie in der

Klinikstichprobe (theoretische Überlegung).

Bei der Analyse der Klinikdaten ergab sich, dass nach den Goodman-Kriterien 551 von 1.221

(45,1%) Patienten auffällige HKS-Scores hatten. Dieser Anteil lag in der Feldstichprobe mit

116 von 1.364 (8,4%) deutlich niedriger. Die genauen Daten einschliesslich der

grenzwertigen und unauffälligen Probanden sind Tabelle 8 zu entnehmen.

46

SAMPLE RKI vs CVK * HKS_JN Kreuztabelle

1151 97 116 1364

84,4% 7,1% 8,5% 100,0%

530 140 551 1221

43,4% 11,5% 45,1% 100,0%

1681 237 667 2585

65,0% 9,2% 25,8% 100,0%

Anzahl% von SAMPLE RKI vs CVKAnzahl% von SAMPLE RKI vs CVKAnzahl% von SAMPLE RKI vs CVK

1 RKI

2 Charite

SAMPLE RKIvs CVK

Gesamt

,00 normal 1,00 grenzw. 2,00 auff.HKS_JN

Gesamt

Tabelle 8: Anteil auffälliger HKS-Scores (Schwellenwertmodell) gegliedert nach Stichprobe

Die Verteilung der Impact-Rohwerte in der Klinikstichprobe, die für die nachfolgenden

Analysen als Approximation herangezogen wird, findet sich in Tabelle 9.

Deskriptiv-Statistik Impact Scores in der Klinikstichprobe

Häufigkeit Prozent Gültige Prozente Kumulierte Prozente

,00 380 31,1 31,1 31,1 1,00 30 2,5 2,5 33,6 2,00 129 10,6 10,6 44,1 3,00 202 16,5 16,5 60,7 4,00 159 13,0 13,0 73,7 5,00 145 11,9 11,9 85,6 6,00 74 6,1 6,1 91,6 7,00 43 3,5 3,5 95,2 8,00 32 2,6 2,6 97,8 9,00 17 1,4 1,4 99,2 10,00 10 ,8 ,8 100,0

Gültig

Gesamt 1221 100,0 100,0

Tabelle 9: Deskriptivstatistik des Impact-Scores in der Klinikstichprobe

47

Um zu einer ersten Einschätzung der Prävalenz des HKS in der Pretest-Stichprobe zu

gelangen, sind folgende Analyse-Schritte erforderlich:

1.) Berechnung des Anteils auffälliger Kinder und Jugendliche (SDQ-Score HKS >=7) im

Pretest = 8,5%.

2.) Davon HKS mit hinreichender Auswirkung auf das psychosoziale Funktionsniveau

(Impact >= 2; Maximalwert geschätzt durch den Anteil in der Klinikstichprobe):

100% -33,6% = 66,4%.

3.) Davon erfüllen in der Klinikstichprobe 96,7% der Probanden auch die geforderte

Symptomdauer von mind. 6 Monaten.

4.) Davon geschätzter Anteil mit tatsächlicher Diagnose (Positver Prädiktiver Wert nach

Goodman et al. 2000): 63,5%.

5.) Hinzu kommen die HKS-Fälle, die in dem SDQ nicht erfasst wurden. Dieser Anteil

lässt sich durch 1 – Sensitivität bestimmen. Goodman et al. (2000) haben für die HKS-

Sensitivität (Anteil der HKS-Fälle, die der Test erkennt) einen Wert von 86,1%

berechnet. Entsprechend ist davon auszugehen, dass 13,9% der HKS-Fälle nicht

erkannt werden.

Unter Berücksichtigung der drei oben genannten Analyseschritte ergibt sich folgende

Prävalenzschätzung auf der Grundlage der verfügbaren Pretest- und Klinik-Daten:

Geschätzte Prävalenz = 8,5% * 0,664 * 0,967 * 0,635 * 1,139 = 3,9 %

Da in diese Prävalenzschätzung der Impact-Anteil der Klinikstichprobe eingeht, von dem

anzunehmen ist, dass er den Maximalwert des Anteils in der Feldstichprobe repräsentiert,

liegt der wahre Prävalenzwert vermutlich unter den berechneten 3,9%. Des weiteren wird die

Zeitdauer der Symptome durch die Klinikstichprobe geschätzt, was abermals als

Maximalwert zu interpretieren ist. Dieser Umstand bedingt, dass auch unter dem

Gesichtspunkt der Symptomdauer die wahre Prävalenz unter dem errechneten Wert liegen

wird. Als dritte Fehlerquelle der aktuellen Schätzung ist auf die Anzahl der Informanten

hinzuweisen. Der positive prädiktive Wert nach Goodman et al. (2000) bezieht sich auf die

Kombination von Eltern, Lehrer und Schülerurteil (letztere ab dem Alter von 11 Jahren). In

unserem Fall wurde die Schätzung nur auf der Grundlage der Elternurteile gefällt. Nach

Goodman et al. (2000) fällt die Sensitivität wie auch der positive prädiktive Wert niedriger

48

aus, wenn weniger Informanten einbezogen werden. In unserem Modell müsste dann der

Anteil der nicht erkannten HKS-Fälle proportional steigen.

Dies bedeutet nicht, dass die Prävalenz insgesamt steigt, da diese von dem Außenkriterium

‚Diagnose’ abhängt. Die Diagnosekriterien sind im logischen Sinne ‚und’-Verknüpfungen

(Auffälligkeiten in der Schule + zuhause + in der Untersuchung + Zeitstabilität +

Ausschlusskriterien nicht erfüllt) so dass sich in der Regel der Anteil der als auffällig

klassifizierten Kinder unter Einbeziehung mehrerer Informanten deutlich reduziert.

Ähnliches erwarten wir, wenn das hier vorgestellte diagnostische Schema im Hauptsurvey

angewandt wird. Wenn die von uns eingesetzte Methode auch weniger psychiatrisch

untermauert ist, als dies in dem britischen Survey der Fall war, so handelt es sich doch in

beiden Vorgehensweisen um eklektisch Prozesse, die aus einer Fülle von Einzelinformationen

auf verschiedenen Aggregations-Ebenen nach einem vorgegebenen Schema die klinische

Diagnostik simulieren.

Wie bereits erwähnt, ist die aktuelle Schätzung von 3,9% als Obergrenze anzusehen. Wie

hoch die Reduktion des Prävalenzwertes in dem Hauptsurvey ausfallen wird, ist nicht

vorhersagbar. Eine Orientierung kann allerdings der schon abgeschlossene britische Survey

darstellen, in dem bei einer Stichprobe von 7.984 Kindern und Jugendlichen 115 mal die

Diagnose HKS und 195 mal die Diagnose ADHD vergeben wurde. Damit liegen die

britischen Prävalenzwerte bei 1,4% für HKS und bei 2,4% für ADHD.

Schließlich sei auf ein weiteres methodisches Detail verwiesen, das mit den unterschiedlichen

Stichproben in dem britischen und deutschen Survey zusammenhängt. Der Altersbereich in

der britischen Stichprobe betrug 5 bis 15 Jahre. In dem deutschen Survey wird das

Altersspektrum von 3 bis 17 Jahre abgebildet. Wie der Graphik über die Altersverteilung in

diesem Forschungsbericht zu entnehmen ist, fallen die Rohwerte in der Feldstichprobe sowohl

im unteren als auch im oberen Altersspektrum niedriger aus, was auch den klinischen

Erfahrungen entspricht. Bezieht man – wie im Falle des deutschen Surveys – diese

Altersspektren mit ein, so ist von niedrigeren Prävalenzen auszugehen. Dieser Effekt wurde in

den hier vorgenommenen Analysen bereits berücksichtig. Dies ist möglicherweise auch eine

Erklärung dafür, dass der Ausgangswert der Analyse von 8,5% um 1,5 Prozentpunkte

unterhalb der 10%-Marke liegt, die nach der Definition des Cut-off auf der Grundlage der 90.

Perzentile zu erwarten gewesen wäre.

49

11 Zusammenfassende Wertung und Ausblick

Das Forschungsprojekt wurde unter folgenden Rahmenbedingungen bzw. Fragestellungen

durchgeführt:

- Die bisherige Datenlage in Deutschland über die Prävalenz des ADHS/HKS ist

äußerst unbefriedigend. In gesundheitspolitischer Hinsicht (z.B. Einschätzung von

Über-, Unter- oder Fehlversorgung; ökonomische Auswirkungen der Störung) ergibt

sich ein dringender Forschungsbedarf.

- Der Kinder- und Jugendsurvey bietet aufgrund seiner Stichprobe, die nach strengen

wissenschaftlichen Kriterien der Repräsentativität in hinreichender Größe (n=17.100)

gezogen wird, ideale Voraussetzungen für nationale Prävalenzschätzungen

psychischer Störungen.

- Um die optimalen Bedingungen der Stichprobe nutzbar zu machen, sollten für die

Prävalenzbestimmungen in erster Linie Daten des Hauptsurveys und erst in zweiter

Linie Daten aus Substichproben, wie beispielsweise aus dem Zusatzmodul

‚Psychische Gesundheit’ herangezogen werden.

- Für eine optimale Prävalenzschätzung des ADHS/HKS wären Diagnosen i.e.S.

erforderlich. Dies würde aber die Durchführung eines umfassenden, strukturierten

oder semi-strukturierten Interviews einschließlich einer kinder- und

jugendpsychiatrischen Evaluation sowie eine ausführliche Eigen- und Fremdanamnese

unter Einbeziehung des Lehrerurteils erforderlich machen. Diese ‚Maximalvariante’

würde den zeitlichen, finanziellen und inhaltlichen Rahmen des Hauptsurveys

sprengen.

- Ziel des Projekts ist es, anhand der vorliegenden Pretest-Daten im Vergleich mit

Klinikdaten zu prüfen, ob und mit welcher Aussagekraft trotz fehlender

‚Maximalvariante’ eine Prävalenzschätzung des ADHS/HKS für Deutschland

durchgeführt werden kann.

- Ziel des Projekts ist es weiterhin, Vorschläge zu unterbreiten, welche zeitökonomisch

vertretbaren Zusatzerhebungen gegebenenfalls erforderlich sind und wie eine

Prävalenzschätzung mit den dann verfügbaren Daten durchgeführt werden kann.

50

- Ein weiteres Ziel des Projekts ist es, zu überprüfen, ob und in welchem Umfang es

Diskrepanzen zwischen dem Gebrauch von Psychostimulanzien (Methylphenidat,

Amphetamin) und dem Vorliegen eines ADHS/HKS gibt.

Das Projekt hat folgende Ergebnisse erbracht:

- Trotz methodischer Abstriche gegenüber der oben erwähnten ‚Maximalvariante’ ist

auf der Grundlage der verfügbaren bzw. der im Rahmen des Projekts ergänzten Daten

mit einer hinreichend stabilen Prävalenzschätzung des ADHS/HKS zu rechnen.

- Die Zusatzuntersuchungen umfassen einerseits die qualifizierte Einschätzung der drei

Hauptsymptome (Aufmerksamkeitsstörung, Impulskontrollstörung und motorische

Unruhe) durch die Untersucher und andererseits der Einsatz objektiver Messmethoden

für die Bestimmung der motorischen Unruhe (Radar-Aktographie).

- Fehlende Angaben (beispielsweise über den Zeitverlauf der Störung und über die

Auswirkungen auf verschiedene Lebensbereiche) müssen über parallel erhobene

Klinikstichproben geschätzt werden.

- Dabei erfolgt die Schätzung konservativ: Der ermittelte Wert ist ein oberer Grenzwert,

d.h. wenn die Analyse beispielsweise eine Prävalenz von 4% ergibt, so liegt der wahre

Wert bei 4% oder darunter, sicher aber nicht darüber.

- Das Training der Interviewer wurde evaluiert und hat gute Übereinstimmungen (Inter-

Rater-Reliabilitäten) zwischen den Untersuchern wie auch zwischen Interviewer-

Urteil und Experten-Urteil erbracht.

- Auf der Grundlage des Pretests und einer Vergleichsanalyse mit einer klinischen

Stichprobe ergab sich eine Prävalenzschätzung von 3,9% (oberer Grenzwert).

- Der Pretest wurde ausschließlich im Sinne einer Machbarkeitsstudie durchgeführt und

erhebt keinen Anspruch auf Repräsentativität. Somit kann die bislang durchgeführte

Analyse auch nicht die Auswertung im Hauptsurvey ersetzen. Auf vorläufige

Auswertungen bezüglich des Medikamentengebrauchs wurde daher verzichtet.

- Die avisierten Analysen über den zum Befragungszeitpunkt aktuellen

Medikamentengebrauch werden im Rahmen des Hauptsurveys realisierbar sein.

51

12 Literatur Barkley, R. A. (2002). "Major life activity and health outcomes associated with attention-deficit/hyperactivity

disorder." J Clin Psychiatry 63 Suppl 12: 10-5. Brown, R. T., W. S. Freeman, et al. (2001). "Prevalence and assessment of attention-deficit/hyperactivity

disorder in primary care settings." Pediatrics 107(3): E43. Bortz, J, G.A. Lienert, K. Boehnke. (1997). Verteilungsfreie Methoden in der Biostatistik. Heidelberg: Springer-

Verlag. Bortz, J. and N. Döring (1995). Forschungsmethoden und Evaluation. Heidelberg, Springer-Verlag. Conners, C. Conners-Rating Scales - Manual. New York: Multi Health Systems. Cohen, J. (1960). "Coefficient of Agreement for Nominal Scales." Education and Psychological Measures 20:

37-46. Cohen, J. (1968). "Weighted Kappa. Nominal Scale Agreement with Provision for Scaled Disagreement or

Partial Credit." Psychological Bulletin 70: 213-220. Dilling, H., W. Mombour, et al. (2000). Internationale Klassifikation psychischer Störungen: Diagnostische

Kriterien für Forschung und Praxis. Bern, Huber Verlag. Ding, Y. C., H. C. Chi, et al. (2002). "Evidence of positive selection acting at the human dopamine receptor D4

gene locus." Proc Natl Acad Sci U S A 99(1): 309-14. Fleiss, J.L. (1971). "Measuring Nominal Scale Agreement among many Raters." Psychol Bulletin 76:378-382. Goodman, R. (1997). "The Strengths and Difficulties Questionnaire: a research note". J Child Psychol

Psychiatry. 38:581-586. Goodman, R., T. Ford, et al. (2000). "Using the Strengths and Difficulties Questionnaire (SDQ) to screen for

child psychiatric disorders in a community sample." Br J Psychiatry 177: 534-539. Goodman, R. (2001). "Psychometric Properties of the Strengths and Difficulties Questionnaire". J Am Acad

Child Adolesc Psychiatry 40(11): 1337-1345. Huss, M., A. Iseler, et al. (2001). "Interkultureller Vergleich der Conners-Skalen: Läßt sich die US-

amerikanische Faktorenstruktur an einer deutschen Stichprobe replizieren?" Z Kinder Jugendpsychiatr Psychother 29(1): 16-24.

Huss, M., C. Stadler, et al. (2002). "ADHS im Lehrerurteil. Ein Vergleich von Klinik- und Normstichprobe anhand der Conners-Skalen." Kindheit und Entwicklung 11(2): 90-97.

Huss, M. "Medikamente und ADS". Berlin, Urania-Verlag. Kurth, B., K.E. Bergmann et al. (2002). "die Gesundheit von Kindern und Jugendlichen in Deutschland: Was wir

wissen, was wir nicht wissen, was wir wissen werden". Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz 45: 852-858.

Newcorn, J. H., J. M. Halperin, et al. (1994). "Parent and teacher ratings of attention-deficit hyperactivity disorder symptoms: implications for case identification." J Dev Behav Pediatr 15(2): 86-91.

Pelham, W. E., Jr., E. M. Gnagy, et al. (1992). "Teacher ratings of DSM-III-R symptoms for the disruptive behavior disorders." J Am Acad Child Adolesc Psychiatry 31(2): 210-8.

Roberts, M. A. (1990). "A behavioral observation method for differentiating hyperactive and aggressive boys." J Abnorm Child Psychol 18(2): 131-42.

Schmeck, K., Poustka, F. et al. (2001)."Discriminant validity of the child behaviour checklist CBCL-4/18 in German samples." Eur Child Adolesc Psychiatry 10(4):240-7.

Swanson, J. (1992). School-based assessment and interventions for ADD students. Irvine CA, K.C. Publishing. Swanson, J. (persönliche Kommunikation). Diskussion im Rahmen des Global ADHD-Meeting in Porto,

Portugal, März 2003. Swanson, J., S. Schuck, et al. (submitted). "Categorial and Dimensional Definitions and Evaluations of

Symtpoms of ADHD: The SNAP and the SWAN Rating Scales. J Clin Psychiatry. Ullmann R.K., E.K. Sleator et al. (1985). "A change of mind: the Conners abbreviated rating scales

reconsidered". J Abnorm Child Psychol.13(4):553-365. Wender, E. H. (2002). "Attention-deficit/hyperactivity disorder: is it common? Is it overtreated?" Arch Pediatr

Adolesc Med 156(3): 209-10. Woerner, W., A. Becker et al. (2002). "Normierung und Evaluation der deutschen Elternversion des Strengths

and Difficulties Questionnaire (SDQ): Ergebnisse einer repräsentativen Felderhebung." Z Kinder- und Jugendpsychiatrie Psychotherapie 30(2), 105-112.

Wolraich, M. L., J. N. Hannah, et al. (1998). "Examination of DSM-IV criteria for attention deficit/hyperactivity disorder in a county-wide sample." J Dev Behav Pediatr 19(3): 162-8.

52

13 Anhang

13.1 Beschreibung des Doppler-Radar-Aktometer

Screening for Attention Deficit Hyperactivity Disorder (ADHD) byDopper-radar assessment of global motor hyperactivity

M. Huss, E. JenetzkyCharité, CVK, Humbold t Univers ität zu Berlin

The Dop pler- effect r efers t o the fr eque ncy shift of wav es, which a re caus ed by m oving

objects. In com binatio n with high fre quency r adar wav es, this techniq ue ope ns the

opport unity to registe r all mov ements of a b ody simult aniously in direct imit ation of the

clinical eye. The f requ ency shift is regist ere d by a receiv er a nd tr ansfo rmed by a n elect ronic

circuit into a recta ngle sig nal indica ting th e mov ement .

The r ectangl e signal is read via the par allel po rt fr om a comm on PC an d an alyzed by a r eal-

time 32 -bit softwa re with an accu racy less t han 1 millisecon d.

The followi ng figu re sh ows the d evice, which is a little la rger than a cigar ette p acket.

Doppler-radar Actomet er

IntroductionGlobal m otor hype ractivity is a co re sy mpto m in c hildre n with Atte ntion Deficit Hype ractivity

Disorder (ADHD). Early awa reness by objective a nd pr ecise meas ure is esse ntial, since

hyperactivity is th e mos t pow erful pre dictor of a dult o utcom e of ADHD. Objective scree ning

tools are nee ded with the following cha racte ristic: They sho uld be exzellen t for scree ning

purpos es ( high sp ecificity), reliable, not har mful f or child ren, rob ust, e asy to use, and

inexpensive.

Until now, mecha nic, op tic or elect romyo grap hic devic es coul d no t fulfill t hese nee ds. They

interfe red wit h the child‘s behavi or a nd we re restrict ed t o single muscl e gr oups. Already by

constructio n, th ey did not sim ulate t he ‚clinical ey e‘, which has p roven to b e the bes t

assessment tool.

A newly develo ped d evice b ased o n Dop pler- rada r cov ers all needs me ntionn ed a bove and

shows so fa r the best test c har acteristics ev er ass essed with objective meth ods.

Klin ik fü r Psych iatrie , Psych o so m atik u n d Psych o th e rapie de s Kin de s- u n dJu g e n dalte rs

D ire kto rin : Pro f. D r. m e d. U. Le h m ku h l

Univ ersitä tsk lin ikum • m edizin ische fa kultä t der hum bo ldt-univ ersitä t zu berlin

The device is not c onfir mative for the diagn osis of ADHD. As was demo nstrat ed in mo re

than 3. 000 patients, its stre ngth l ays in th e scre ening pro perty to co rrectly classify h ealthy

children as healty (high specificity ). With othe r wo rds: I f a child sc ores low o n t he rada r-

assessment of glo bal mo tor ac tivity, ADHD in the st rict definiti on of the WHO (hype rkientic

syndrom e acco rding ICD -10) can b e rule d out.

Children with high lev els of m otor activity shoul d be f urth er assess ed.

To ou r kn owledge, this is t he fi rst obj ective d evice with optimize d scre ening pro perti es, in

a field, w here subjec tive m ethods ar e the basis f or f ar reachin g decisi ons suc h as

medicatio n or psychologic al and educa tional int erve ntions.

The act omet er is plac ed 1. 5 met er in f ront of th e child with out h aving a ny physic al contac t to

the pr oban d. Th eref ore n o inte rfer ence with t he child‘s behavi or is to be exp ected. The rad a r

transmitt er has a CE-certifica te a nd radiat es less t han 0.1% of the ad mitted leack radi ation

of conven tional microwaves . Th erefo re it is n ot ha rmful f or child ren.

The n ext pict ure s hows a n ap plication in co mbinati on with an electr oence phalog ram. In the

last track th e rect angle global moto r impuls e of a ny body move ment c an be seen.

Accumulating the i mpulses ove r 10 minu tes r esults in an glob al m otor activity sc ore, which

can be co mpa red with nor m dat a fro m 20. 000 child ren of a r epr esentativ e Ger man s ample.

As demonstr ated in t he nex t figur e, the in dividual co mpa rison is do ne ag e and gend e r

stratified, si nce b oth fact ors have a significa nt influ ence on th e level of gl obal motor activity .

The g rap h of t he 95% confid ence interv al hel ps to estimat e, h ow muc h th e individ ual sco re

differs fr om th e no rm.

Application

53

13.2 SPSS-Steuerfile SDQ-Auswertung * Klinikdatensatz um neue Daten aus der ACCESS-Datenbank SDQ erweitern. GET FILE='C:\RKI\SDQ_Vergleich\gesamt_KLINIK_Eltern_03_07_03.sav'. * hinzugefuegte Daten mit sample = x (in diesem Fall sample=3) gekennzeichnet. do if (sample = 3). compute wob1_el = i1. compute wob2_el = i2. compute wob3_el = i3. compute wob4_el = i4. compute wob5_el = i5. compute wob6_el = i6. compute wob7_el = i7. compute wob8_el = i8. compute wob9_el = i9. compute wob10_el = i10. compute wob11_el = i11. compute wob12_el = i12. compute wob13_el = i13. compute wob14_el = i14. compute wob15_el = i15. compute wob16_el = i16. compute wob17_el = i17. compute wob18_el = i18. compute wob19_el = i19. compute wob20_el = i20. compute wob21_el = i21. compute wob22_el = i22. compute wob23_el = i23. compute wob24_el = i24. compute wob25_el = i25. end if. exe. do if (sample = 3). compute kj_sex = geschlec. end if. exe. * Dezimale Altersberechung an der Klinik-Stichprobe. COMPUTE jahr = XDATE.YEAR(u_datum). COMPUTE mon = XDATE.MONTH(u_datum). COMPUTE tag = XDATE.MDAY(u_datum). COMPUTE endtage = YRMODA(jahr,mon,tag). COMPUTE year = XDATE.YEAR(kj_gd). COMPUTE month = XDATE.MONTH(kj_gd). COMPUTE day = XDATE.MDAY(kj_gd). COMPUTE anftage = YRMODA(year,month,day). COMPUTE agetage = endtage - anftage . COMPUTE KJ_ALTX = agetage / 365.25 . cache. EXECUTE . fre var kj_altx /sta min max mean. exe. * RKI-Datensatz oeffnen. * RKI-Datensatz. *. * urspruenglicher Datensatz vom RKI n=1626. * abzueglich n=9 ohne eingegebene Daten.

54

* abzueglich n=198 ohne Fragebogen. * abzueglich n=55 mit mehr als einem missing. * es resultiert ein verfuegbarer RKI-Datensatz von n=1364. *. * Achtung: Item 1 bis 25 wurde im RKI mit 1-2-3 (entgegen der Goodman-Konvention) kodiert. * werden einheitlich in dem Gesamtdatensatz nach den Goodman-Konventionen mit 0-1-2 kodiert. GET FILE='C:\RKI\SDQ_Vergleich\RKI_Daten.sav'. * Umkodierung der Itemwerte in der RKI-Stichprobe. do if (sample = 1). recode wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el (1=0) (2=1) (3=2). end if. exe. SAVE OUTFILE='C:\RKI\SDQ_Vergleich\RKI_Daten_Items_umkodiert.sav' /COMPRESSED. * Umkodierten RKI-DAtensatz einlesen. GET FILE='C:\RKI\SDQ_Vergleich\RKI_Daten_Items_umkodiert.sav'. * mit Klinikdatensatz zusammenfuegen. ADD FILES /FILE=* /FILE='C:\RKI\SDQ_Vergleich\gesamt_KLINIK_Eltern_03_07_03.sav'. EXECUTE. recode sample (3=2). exe. val lab wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el 0 'nicht zutreffend' 1 'teilweise zutreffend' 2 'eindeutig zutreffend' . exe. RECODE wob1_el wob2_el wob3_el wob4_el wob5_el wob6_el wob7_el wob8_el wob9_el wob10_el wob11_el wob12_el wob13_el wob14_el wob15_el wob16_el wob17_el wob18_el wob19_el wob20_el wob21_el wob22_el wob23_el wob24_el wob25_el (9=SYSMIS) . EXECUTE . * Skalenbildung. * SDQ-Auswertung. * Grundlage: Scoring_instructions Stand 2.4.02 aus www.sdqinfo.com. * Skala: Emotionale Probleme. * (kein Item invers). *-----------------------. compute emotion = sum(wob3_el,wob8_el,wob13_el,wob16_el,wob24_el). exe. if (emotion <=3) emot_jn = 0. if (emotion = 4) emot_jn = 1. if (emotion >=5) emot_jn = 2. val lab emot_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Verhaltensprobleme. * (Item 7 ist invers). *-----------------------. recode wob7_el (2 = 0) (1 = 1) (0=2) into wob7r_el. compute beha = sum(wob5_el,wob7r_el,wob12_el,wob18_el,wob22_el). exe. if (beha <=2) beha_jn = 0. if (beha = 3) beha_jn = 1. if (beha >=4) beha_jn = 2.

55

val lab beha_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Hyperaktivität. * (Item 21 und Item 25 sind invers). *-----------------------. recode wob21_el wob25_el (2 = 0) (1 = 1) (0=2) into wob21r_e wob25r_e. compute hks = sum(wob2_el,wob10_el,wob15_el,wob21r_e,wob25r_e). exe. if (hks <=5) hks_jn = 0. if (hks = 6) hks_jn = 1. if (hks >=7) hks_jn = 2. val lab hks_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Verhaltensprobleme mit Gleichaltrigen. * (Item 11 und Item 14 sind invers). *-----------------------. recode wob11_el wob14_el (2 = 0) (1 = 1) (0=2) into wob11r_e wob14r_e. compute peer = sum(wob6_el,wob11r_e,wob14r_e,wob19_el,wob23_el). exe. if (peer <=2) peer_jn = 0. if (peer = 3) peer_jn = 1. if (peer >=4) peer_jn = 2. val lab peer_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. * Skala: Prosoziales Verhalten. * (kein Item ist invers). *-----------------------. compute pros = sum(wob1_el,wob4_el,wob9_el,wob17_el,wob20_el). exe. if (pros <=4) pros_jn = 2. if (pros = 5) pros_jn = 1. if (pros >=6) pros_jn = 0. val lab pros_jn 0 'normal' 1 'grenzw.' 2 'auff.'. exe. compute total = emotion + peer + beha + hks. exe. * Impact-Skala. * Berechnet nach den Scoring-instructions english version unter sdqinfo.com . RECODE problems (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_prob . VARIABLE LABELS imp_prob 'Problems Scoring Variable'. EXECUTE . fre var imp_prob. exe. RECODE haus_m (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_haus . VARIABLE LABELS imp_prob 'Haus Scoring Variable'. EXECUTE . fre var imp_haus. exe. RECODE freunde_ (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_freu . VARIABLE LABELS imp_prob 'Freunde Scoring Variable'. EXECUTE . fre var imp_freu. exe. RECODE schule_m (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_schu . VARIABLE LABELS imp_prob 'Schule Scoring Variable'. EXECUTE . fre var imp_schu.

56

exe. RECODE freizeit (0=0) (1=0) (2=1) (3=2) (9=SYSMIS) INTO imp_frei . VARIABLE LABELS imp_prob 'Freizeit Scoring Variable'. EXECUTE . fre var imp_frei. exe. * wenn keine Probleme benannt sind bzw wenn die erste Frage mit 'nein' beantwortet wird, * alle anderen Impact-Items auf Null setzen. if (sysmis(imp_prob) or imp_prob = 0) imp_prob = 0. if (sysmis(imp_prob) or imp_prob = 0) imp_haus = 0. if (sysmis(imp_prob) or imp_prob = 0) imp_freu = 0. if (sysmis(imp_prob) or imp_prob = 0) imp_schu = 0. if (sysmis(imp_prob) or imp_prob = 0) imp_frei = 0. exe. * Impact-Score berechnen. compute impact = sum(imp_prob,imp_haus,imp_freu,imp_schu,imp_frei). exe. fre var impact. exe. * Zeitkriterium >= 6 Monate berechnen. * seitwann = 2 entspricht 6 - 12 Monate. fre var seitwann. exe. RECODE seitwann (0=0) (1=0) (2=1) (3=1) (9=0) (SYSMIS=0) INTO hks_zeit. VARIABLE LABELS hks_zeit 'Zeitkriterium >= halbes Jahr'. EXECUTE . val lab hks_zeit 0 '< 6 Monate' 1 '>= 6 Monate'. exe. fre var hks_zeit. exe. * Berechnung der HKS-Kriterien. * 1 = nur Skala positiv. * 2 = Skala und Impact positiv. * 3 = Skala, Impact und Zeitkriterium erfuellt. if (hks_jn = 2) hks_crit = 1. if (hks_jn = 2 & impact >=2) hks_crit = 2. if (hks_jn = 2 & impact >=2 & hks_zeit=1) hks_crit = 3. exe. fre var hks_crit. exe. SAVE OUTFILE='C:\RKI\SDQ_Vergleich\total_sample.sav' /COMPRESSED. Get file = 'C:\RKI\SDQ_Vergleich\total_sample.sav'. GRAPH /ERRORBAR( CI 95 )= emotion beha hks peer pros total BY sample /MISSING=LISTWISE REPORT. MEANS TABLES=emotion beha hks peer pros total BY sample /CELLS MEAN COUNT STDDEV /STATISTICS ANOVA . CROSSTABS /TABLES=sample BY emot_jn beha_jn hks_jn peer_jn pros_jn /FORMAT= AVALUE TABLES /CELLS= COUNT ROW .

57

* Altersmittelwerte zwischen Klinik und RKI vergleichen. MEANS TABLES=kj_altx BY sample /CELLS MEAN COUNT STDDEV /STATISTICS ANOVA . * Mittelwerte vergleichen fuer ROC-Analysen. MEANS TABLES=emotion beha peer hks BY sample /CELLS MEAN COUNT STDDEV . ROC hks beha peer emotion BY sample (2) /PLOT = CURVE /PRINT = SE COORDINATES /CRITERIA = CUTOFF(INCLUDE) TESTPOS(LARGE) DISTRIBUTION(FREE) CI(95) /MISSING = EXCLUDE . if (hks >=4) hks_cut = 1. if (hks < 4) hks_cut = 0. exe. fre var hks_cut. exe.

58

SDQ-Fragebogen für Eltern (Klinikversion im Original; Layout formatierungsbedingt abweichend) ELTERN-FRAGEBOGEN

(Fragebogen zu Stärken und Schwächen SDQ-DEU)

Name, Vorname des Kindes

Geschlecht: weiblich männlich Geburtsdatum: . . Fragebogen ausgefüllt am: . . 200 durch: Mutter Vater Andere Bezugsperson

Bitte markieren Sie zu jedem Punkt “Nicht zutreffend“, “Teilweise zutreffend“ oder “Eindeutig zutreffend“.

Beantworten Sie bitte alle Fragen so gut Sie können, selbst wenn Sie sich nicht ganz sicher sind oder Ihnen eine Frage merkwürdig vorkommt. Bitte berücksichtigen Sie bei der Antwort das Verhalten Ihres Kindes in den

letzten sechs Monaten. Nicht

zutreffend Teilweise zutreffend

Eindeutig zutreffend

Rücksichtsvoll

Unruhig, überaktiv, kann nicht lange stillsitzen

Klagt häufig über Kopfschmerzen, Bauchschmerzen oder Übelkeit

Teilt gerne mit anderen Kindern (Süßigkeiten, Spielzeug, Buntstifte usw.)

Hat oft Wutanfälle, ist aufbrausend

Einzelgänger; spielt meist alleine

Im allgemeinen folgsam; macht meist, was Erwachsene verlangen

Hat viele Sorgen; erscheint häufig bedrückt

Hilfsbereit, wenn andere verletzt, krank oder betrübt sind

Ständig zappelig

Hat wenigstens einen guten Freund oder eine gute Freundin

Streitet sich oft mit anderen Kindern oder schikaniert sie

Oft unglücklich oder niedergeschlagen; weint häufig

Im allgemeinen bei anderen Kindern beliebt

Leicht ablenkbar, unkonzentriert

Nervös oder anklammernd in neuen Situationen; verliert leicht das Selbstvertrauen

Lieb zu jüngeren Kindern

Lügt oder mogelt häufig

Wird von anderen gehänselt oder schikaniert

Hilft anderen oft freiwillig (Eltern, Lehrern oder anderen Kindern)

Denkt nach, bevor er/sie handelt

Stiehlt zu Hause, in der Schule oder anderswo

Kommt besser mit Erwachsenen aus als mit anderen Kindern

Hat viele Ängste; fürchtet sich leicht

Führt Aufgaben zu Ende; gute Konzentrationsspanne

Gibt es noch etwas, das Sie erwähnen möchten?

59

Würden Sie sagen, dass Ihr Kind insgesamt gesehen in einem oder mehreren der folgenden Bereiche Schwierigkeiten hat: Stimmung, Konzentration, Verhalten, Umgang mit Anderen?

Ja, leichte Ja, deutliche Ja, massive

Nein Schwierigkeiten Schwierigkeiten Schwierigkeiten

Falls Sie diese Frage mit “Ja“ beantwortet haben, beantworten Sie bitte auch die folgenden Punkte: • Seit wann gibt es diese Schwierigkeiten?

Weniger als 1-5 6-12 Über einen Monat Monate Monate ein Jahr

• Leidet Ihr Kind unter diesen Schwierigkeiten?

Gar nicht Kaum Deutlich Massiv • Wird Ihr Kind durch diese Schwierigkeiten in einem der folgenden Bereiche des

Alltagslebens beeinträchtigt?

Gar nicht Kaum Deutlich Schwer

Zu Hause Mit Freunden Im Unterricht

In der Freizeit • Stellen die Schwierigkeiten eine Belastung für Sie oder die gesamte Familie dar?

Keine Leichte Deutliche Schwere Belastung Belastung Belastung Belastung

Vielen Dank für Ihre Hilfe

60