Produkte - firsttrimester.net · Produkte Einleitung, Testbezeichnung bietet Ihnen als weltweit...

Produkte Einleitung, Testbezeichnung www.firsttrimester.net bietet Ihnen als weltweit erste Internet-Plattform die Möglichkeit, die

individualisierte Risikokalkulation - altersabhängig - teilindividualisiert

nach dem Prinzip der Arbeitsgruppe um Professor Nicolaides, London

- altersunabhängig – vollindividualisiert nach dem AFS® -Prinzip von Schmidt und Scharf, Med. Hochschule Hannover bzw. Universitätsfrauenklinik Heidelberg

fußend auf

- der fetalen Nackentransparenz (Nuchal Translucency, NT, Nackenfalte) - dem im mütterlichen Blut gemessenen freien ß-HCG - dem im mütterlichen Blutgemessenen PAPP-A

für Feten zwischen der 11+0 und der 13+6 Schwangerschaftswoche (SSW) durchzuführen. Diese Berechnung wird mit unterschiedlichen Bezeichnungen versehen. Meist spricht man im Zusammenhang hiermit von

- Ersttrimesterscreening (ETS) - NT-Screening - NT-Test - Nackenfaltentest

Testaussage, Bedeutung Der Sinn dieser Berechnung ist es, jeder Schwangeren die Auskunft zu geben, wie hoch jetzt ihr ganz persönliches Risiko dafür ist, daß ihr ungeborenes Kind von einem Down-Syndrom (früher: „Mongolismus“) betroffen sein könnte. Dabei ist das Down-Syndrom die Spitze des Eisberges:

- Es ist die häufigste über eine Fruchtwasseranalyse (~ Chromosomenanalyse) vorgeburtlich diagnostizierbare genetische Erkrankung

- Es ist, kommt es zur Geburt, mit einem Langzeit-Überleben verbunden - Die hiervon betroffenen Menschen haben hinsichtlich ihrer psychomentalen

Entwicklung eine ungünstige Prognose (5% geistig leicht, 25% geistig mäßiggradig, 2/3 geistig schwer behindert)

Andere, ebenfalls über die NT-Messung diagnostizierbare genetische Erkrankungen (Edwards-Syndrom, Pätau-Syndrom) sind mit einer deutlich niedrigeren Eintritts-Wahrscheinlichkeit, einer stärkeren geistigen Behinderung und einer deutlich schlechteren nachgeburtlichen Überlebensprognose versehen. Insoweit wird die generelle Frage: „Könnte das ungeborenen Leben von einer genetischen Erkrankung betroffen sein“, in Zahlen ausgedrückt an der häufigsten und bedeutsamsten Form, nämlich dem Down-Syndrom fest gemacht. An dieser Stelle sei ausdrücklich darauf hingewiesen, daß Sinn und Zweck einer derartigen Risikoeinschätzung nicht die Festlegung eines Fürs oder Widers ist, was die Schwangerschaft an sich anbelangt. Es handelt sich hier lediglich um ein Suchverfahren, solche Schwangerschaften korrekt zu erfassen, bei welchen eine gegenüber der „normalen Schwangerschaft“ erhöhte Wahrscheinlichkeit für das Vorliegen eines Downsyndroms gegeben ist. Diese Information dient als Entscheidungsgrundlage für die individuelle Schwangere, ob sie sich (bei auffälligem Test mit einem dann rationalen Grund und nicht aus einer alleinigen Bauchentscheidung heraus) einer weiterführenden, dann invasiven Diagnostik (Fruchtwasseruntersuchung - Amniozentese 15.-17. SSW, Chorionzottenbiopsie 11.-14. SSW) unterziehen sollte. Damit ist der Sinn des Testes, bildlich gesprochen, im Meer der vorgeburtlichen Medizin solche Schwangerschaften zu entdecken, bei welchen eine weiterführende invasive Diagnostik Sinn macht, sofern die Schwangere sich mit der Frage beschäftigt: „Könnte mein Kind genetisch krank sein“. Der Test dient damit als Netz, in welchem solche Schwangerschaften erfasst werden sollen, bei welchen sich der Anfangsverdacht auf eine genetische Auffälligkeit ergibt. Die logische Folge eines auffälligen Befundes ist es, eine invasive Diagnostik durchführen zu lassen (Fruchtwasseruntersuchung oder Mutterkuchenprobe-Chorionzottenbiopsie): Nur diese Vorgehensweise ermöglicht eine klare und endgültige Antwort auf die Frage, ob das ungeborene Kind vom Down-Syndrom betroffen ist oder nicht.

Ein häufiges Mißverständnis an diesem Punkt ist, „Test-Auffällig“ bedeute, das ungeborene Kind sei krank: Die überwiegende Mehrzahl selbst solcher Schwangeren, welche im Test „positiv“ sind, tragen in Wirklichkeit ein gesundes Kind aus: Führt man eine alleinige NT-Messung (=eigentlich „Alter + NT“) durch und kalkuliert dann das sog. adaptierte Risiko, so findet sich bei 3 von 100 der positiv bzw. auffällig getesteten Schwangeren bei Durchführung einer weitergehenden invasiven Diagnostik ein krankes Kind (positiver Test-Vorhersagewert: 3%). Dies bedeutet im Umkehrschluß: Selbst bei auffälliger Testung haben immerhin 97 von 100 „positiv“ getesteten Schwangeren tatsächlich ein gesundes Kind. Führt man eine mit der Biochemie kombinierte NT-Messung (=eigentlich „Alter + NT+ Biochemie (Papp-A und fßHCG)“) durch und kalkuliert dann das sog. adaptierte Risiko, so findet sich bei 8 von 100 der positiv bzw. auffällig getesteten Schwangeren bei Durchführung einer weitergehenden invasiven Diagnostik ein krankes Kind (positiver Test-Vorhersagewert: 8%). Dies bedeutet im Umkehrschluß: Selbst bei auffälliger Testung haben immerhin 92 von 100 „positiv“ getesteten Schwangeren tatsächlich ein gesundes Kind. Aber: 8 von 10 Kinder, die tatsächlich ein Down-Syndrom tragen, werden bei der alleinigen Nackentransparenzmessung als auffällig („testpositiv“) charakterisiert, 9 von 10 Kinder, die tatsächlich ein Down-Syndrom tragen, werden bei der mit Biochemie kombinierten Nackentransparenzmessung als auffällig („testpositiv“) eingestuft. Das bedeutet, daß der kombinierte NT-Test bei 90% aller kranken Kinder eine richtige Zuweisung durchführt. Diese lautet: „Hier liegt eine auffällige Befund-Konstellation vor. Eine weiterführende Diagnostik (Fruchtwasseruntersuchung oder Chorionbiopsie) macht Sinn. In der dann folgerichtigen Konsequenz, eine invasive Diagnostik durchführen zu lassen, werden dann auch diese 9 von 10 Down-Syndrom-Kinder als solche erfasst. Insoweit ist die häufigste und typische Wahrscheinlichkeit im Falle eines „auffälligen“ = positiven Testergebnisses: Ich bin positiv getestet worden. Eine weiterführende invasive Diagnostik sollte durchgeführt werden, nicht um zu beweisen: Das Kind ist krank. Sondern um, dann aus guten Gründen, nachzuweisen, daß das Kind, auch bei auffälligem Testergebnis, in Wirklichkeit gesund ist. Sollte der psychologisch widrige Umstand eintreten, dass in Folge dieser Diagnostik tatsächlich eine Schwangerschaft mit Downsyndrom festgestellt wird, so darf die Schwangere mit diesem Wissen keinesfalls allein gelassen werden; vielmehr sollte eine umfangreiche Betreuung und Beratung der Schwangeren in einem Netzwerk kompetenter Experten (Psychologe, Genetiker, Pränatalmediziner, Kinderarzt, Betroffenengruppe) erfolgen. Der Entscheidung, wie die hiervon betroffene Schwangere in der Konsequenz ihres Handelns letztlich mit einer derartigen Information umgeht, muß mit Respekt und Achtung begegnet werden.

Testentwicklung-Altersrisiko Fragt man sich nach der Berechtigung, eine derartige Suchstrategie auf das Down-Syndrom zur Anwendung zu bringen, so lautet die Antwort: Die Durchführung eines derartigen Tests macht immer mehr Sinn. Hintergrund hierfür sind folgende Überlegungen:

- Immer weniger Frauen bekommen immer später Kinder - Die daraus abgeleitete tatsächliche Wahrscheinlichkeit, ohne entsprechende

medizinische Maßnahmen ein woran auch immer erkranktes Neugeborenes zu gebären, steigt deutlich an

- Darüberhinaus gibt es immer mehr Schwangere, die aufgrund ihrer individuellen Lebensumstände ein erhöhtes Risikoprofil für genetische, aber auch körperliche Störungen mit sich bringen (Zucker, erhöhtes Gewicht), für welche die NT-Messung empfindlich ist

Insbesondere der erste Punkt bedingt, daß die durchschnittliche Wahrscheinlichkeit, ein Kind mit Down-Syndrom zu gebären, in den letzten Jahren deutlich gestiegen ist. Diese vordergründige Wertung des Alters der Schwangeren stammt aus den 1970er Jahren. Sie beruht auf der alleinigen Betrachtung eines mütterlichen Risikofaktors im Hinblick auf die Frage: Ist mein ungeborenes Kind mutmaßlich genetisch gesund oder krank? Damit vermag das mütterlich Alter allein eine nur sehr allgemeine, keinesfalls aber individuelle Aussage hierzu leisten. Die Empfindlichkeit (Sensitivität) dieser Logik der Risikoermittlung ist darüber hinaus recht niedrig. Definiert man das altersbedingte Risiko einer 35-jährigen Frau (1:300 für Downsyndrom) als Grenze, ab welcher man einer Frau zu einer invasiven Diagnostik rät, so werden nur 30 bis 50% aller tatsächlich vorliegenden Downsyndrom-Schwangerschaften in der Folge der genetischen Diagnostik erfasst. Die Präzision der Vorhersage bei auffälliger Testung ist dabei sehr niedrig: Die Wahrscheinlichkeit, bei einem Alter über 35 Jahren tatsächlich ein vom Downsyndrom betroffenes Kind zu tragen, liegt über alle Schwangerschaftsalter hinweg (Betrachtung aller schwangerer Frauen, die 35 Jahre und älter sind, gemeinsam) bei etwa 0,3% (sog. Positiver Vorhersagewert, PPV).

Testentwicklung - Labortests In den 1980er und 1990er Jahren gelang es, zunächst für das zweite Schwangerschaftsdrittel (sog. Triple-Test), dann auch für das späte erste Schwangerschaftsdrittel (Ersttrimester-Labortest mit Papp-A und freiem ß-HCG) Substanzen im mütterlichen Blut zu identifizieren, die eine individuelle, auf die jeweilige Schwangerschaft spezifisch berechnete Risikoeinschätzung erlauben (1). Entscheidend hierbei ist, dass diese Substanzen zwar im mütterlichen Blut bestimmt werden, eigentlich aber vom ungeborenen Kind, genauer: seiner Placenta stammen. Es handelt sich damit um eine spezifische (vom individuellen Kind der individuell ratsuchenden Schwangeren) stammende Information. Diese wird mit dem mütterlichen Altersrisiko nach einer schlüssigen, im Weiteren noch zu erklärenden (Vergl. Kapitel „Risikokalkulationssoftware-Varianten zur Ermittlung des adjustierten Risikos für das Vorliegen eines Downsyndroms im Rahmen der kombinierten Nackentransparenzmessung (Kombinierter NT-Test, „Ersttrimesterscreening – ETS“) nach Nicolaides“) Logik der Risikobetrachtung (Sog. Risikokalkulationsalgorithmus) verbunden: Von der Testtheorie her wird also ein unspezifisch-allgemeines mütterliches Altersrisiko mit einem spezifisch-kindlichen Risiko zu einem Mischrisiko verbunden! Die Empfindlichkeit (Sensitivität) dieser Logik der Risikoermittlung ist im Vergleich zur alleinigen Altersbetrachtung zwar immer noch nicht hoch, aber schon deutlich besser. Auch hier wird bei dem kalkulierten Mischrisiko das altersbedingte Risiko einer 35-jährigen Frau (1:300 für Downsyndrom) als Grenze herangezogen, ab welcher man einer Frau zu einer invasiven Diagnostik rät. Auf diese Art werden immerhin 60% aller tatsächlich vorliegenden Downsyndrom-Schwangerschaften über die dem auffälligen Testergebnis folgende invasive genetische Diagnostik erfasst. Die Präzision der Vorhersage bei auffälliger Testung ist dabei etwa 10x höher als bei der alleinigen Altersbetrachtung, dennoch immer noch niedrig: Die Wahrscheinlichkeit, bei einem auffälligen Labortest tatsächlich ein vom Downsyndrom betroffenes Kind zu tragen, liegt über alle Fälle hinweg bei etwa 2% (sog. Positiver Vorhersagewert, PPV). Anders formuliert: Von hundert testpositiven Schwangeren werden (bei Kenntnis des dann unauffälligen genetischen Ergebnisses) im Rückblick 100% - 2% = 98% unnötigerweise punktiert und einem Abortrisiko ausgesetzt.

Testentwicklung - Nackentransparenzmessung nach Nicolaides In den 1990er Jahren gelang es, in der Nackentransparenzmessung für das späte erste Schwangerschaftsdrittel ein Ultraschall-Merkmal (sog. Ultraschall-Marker) zu identifizieren, welches ähnlich wie die Labortests eine individuelle, auf die jeweilige Schwangerschaft spezifisch berechnete Risikoeinschätzung erlaubt (2). Feten mit einer Trisomie 21/Downsyndrom haben eine durchschnittlich um 2 mm höhere Nackentransparenz (im Mittel 3,5 mm versus im Mittel 1,5 mm bei genetisch gesunden Feten). Entscheidend hierbei ist, dass diese Information, über die Ultraschalluntersuchung direkt abrufbar, vom ungeborenen Kind selbst stammt (3). Um eine hinreichende Vergleichbarkeit und Reproduzierbarkeit der Ultraschall-Messergebnisse zu gewährleisten (Objektivität, Reliabilität, Validität, die drei wichtigsten Gütekriterien für empirische Untersuchungen) wurde eine präzise Messvorgabe (Messebene, fetale Haltung, Vergrößerung) definiert. Nur bei Einhaltung der diesbezüglichen sonographischen Kriterien ist die durchgeführte Messung im Hinblick auf die sich hierauf aufbauende Risikokalkulation verwertbar. Es wurde weiter festgelegt, daß die Qualität der durchgeführten NT-Messungen zur Aufrechterhaltung eines sonographischen Mindeststandards jährlich im Rahmen eines sogenannten „Audits“ durch eine externe Qualitätssicherungsstelle überprüft werden soll, um eine Objektivität und Reliabilität der Messungen zu gewährleisten. Bei der Nackentransparenzmessung handelt es sich damit erneut um eine spezifische (vom individuellen Kind der individuell ratsuchenden Schwangeren) stammende Information. Diese wird mit dem mütterlichen Altersrisiko nach derselben schlüssigen Logik der Risikobetrachtung wie bei den Labortests (Vergl. Kapitel „Risikokalkulationssoftware-Varianten zur Ermittlung des adjustierten Risikos für das Vorliegen eines Downsyndroms im Rahmen der kombinierten Nackentransparenzmessung (Kombinierter NT-Test, „Ersttrimesterscreening – ETS“) nach Nicolaides“) verbunden: Es resultiert hieraus ein sogenanntes angepasstes Risiko dafür, dass das ungeborene Kind vom Downsyndrom betroffen sein könnte. Von der Testtheorie her wird also erneut ein unspezifisch-allgemeines mütterliches Altersrisiko mit einem spezifisch-kindlichen Risiko zu einem Mischrisiko verbunden! Die Empfindlichkeit (Sensitivität) dieser Logik der Risikoermittlung ist im Vergleich zur alleinigen Altersbetrachtung jetzt erstmals mit 75-80% für die Entdeckung des Downsyndroms über die dem auffälligen Testergebnis folgende invasive genetische Diagnostik derart hoch, dass mit ihr in der praktischen Anwendung gearbeitet werden kann. Auch hier wird bei dem solcherart kalkulierten Mischrisiko das altersbedingte Risiko einer 35-jährigen Frau (1:300 für Downsyndrom) als Grenze herangezogen, ab welcher man einer Frau zu einer invasiven Diagnostik rät. Die Präzision der Vorhersage bei auffälliger Testung ist dabei immer noch niedrig: Die Wahrscheinlichkeit, bei einem auffälligen Labortest tatsächlich ein vom Downsyndrom betroffenes Kind zu tragen, liegt über alle Fälle hinweg ebenfalls, wie bei der Laborbetrachtung, in einem Bereich von etwa 3% (sog. Positiver

Vorhersagewert, PPV). Anders formuliert: Von hundert testpositiven Schwangeren werden (bei Kenntnis des dann unauffälligen genetischen Ergebnisses) im Rückblick 100% - 3% = 97% unnötigerweise punktiert und einem Abortrisiko ausgesetzt.

Testentwicklung- kombinierte Nackentransparenzmessung (sog. Kombinierter NT-Test, „Ersttrimesterscreening – ETS“) nach Nicolaides Ende der 90er/Anfang der 2000er Jahre wurden die Nackentransparenzmessung und der Ersttrimester-Labortest miteinander zu einem kombinierten Test verbunden. Dies geschah in der Form, dass das mütterliche Altersrisiko nach derselben schlüssigen Logik der Risikobetrachtung mit den beiden individuellen fetalen Risiken aus der Laborbestimmung und der NT-Messung verbunden wurden. Entscheidend hierbei ist, dass diese Informationen vom ungeborenen Kind selbst stammen. Es handelt sich damit erneut um eine über die NT-Information und die Laborinformation jetzt doppelt spezifische (vom individuellen Kind der individuell ratsuchenden Schwangeren stammende) Aussage. Diese wird mit dem mütterlichen Altersrisiko nach demselben schlüssigen Prinzip der Risikobetrachtung wie bei den Labortests und der alleinigen NT-Messung (Vergl. Kapitel „Risikokalkulationssoftware-Varianten zur Ermittlung des adjustierten Risikos für das Vorliegen eines Downsyndroms im Rahmen der kombinierten Nackentransparenzmessung (Kombinierter NT-Test, „Ersttrimesterscreening – ETS“) nach Nicolaides“) verbunden: Es resultiert hieraus ein sogenanntes angepasstes Risiko dafür, dass das ungeborene Kind vom Downsyndrom betroffen sein könnte. Von der Testtheorie her wird also erneut ein unspezifisch-allgemeines mütterliches Altersrisiko mit jetzt zwei spezifisch-kindlichen Risiken zu einem Mischrisiko verbunden! Die Empfindlichkeit (Sensitivität) dieser Logik der Risikoermittlung liegt im Vergleich zur alleinigen Altersbetrachtung jetzt bei komfortablen 90% für die Entdeckung des Downsyndroms über die dem auffälligen Testergebnis folgende invasive genetische Diagnostik. Es damit die empfindlichste Methode, mit welcher in der praktischen Anwendung gearbeitet werden kann. Auch hier wird bei dem kalkulierten Mischrisiko das altersbedingte Risiko einer 35-jährigen Frau (1:300 für Downsyndrom) als Grenze herangezogen, ab welcher man einer Frau zu einer invasiven Diagnostik rät. Folgerichtig hat sich die kombinierte Nackentransparenzmessung zum gegenwärtig noch gültigen Goldstandard für diesen wichtigen Bereich der Pränatalmedizin entwickelt. Die Präzision der Vorhersage bei auffälliger Testung ist dabei immer noch niedrig und insgesamt nicht viel höher als bei der alleinigen NT-Messung oder Durchführung eines Papp-A/freies ß-HCG-Labortests: Die Wahrscheinlichkeit, bei einem auffälligen Labortest tatsächlich ein vom Downsyndrom betroffenes Kind zu tragen, liegt über alle Fälle hinweg maximal in einem Bereich von etwa 5-8% (sog. Positiver Vorhersagewert, PPV): Auch hier werden immer noch 92 bis 95 von hundert testpositiven Schwangeren (bei Kenntnis des dann unauffälligen genetischen Ergebnisses) im Rückblick unnötigerweise punktiert und einem Abortrisiko ausgesetzt.

Risikokalkulationssoftware-Varianten zur Ermittlung des adjustierten Risikos für das Vorliegen eines Downsyndroms im Rahmen der kombinierten Nackentransparenzmessung (Kombinierter NT-Test, „Ersttrimesterscreening – ETS“) nach Nicolaides – Historische Entwicklung Der beim Prinzip der Risikoberechnung im Konzept von Nicolaides benutzte Algorithmus zur Ermittlung des sogenannten „adjustierten“ Risikos für das Vorliegen eines Downsyndroms zeichnet sich durch mehrere, ihn charakterisierende Eigenschaften aus:

- Das Prinzip des Algorithmus ist nicht neu: Die Art, wie bisher weltweit Risiken in der Pränatalmedizin kalkuliert wurden, ist historisch bedingt und gewachsen. Sie kann nur verstanden werden, wenn man im Groben die Entwicklung der Pränatalmedizin kennt: Ausgangspunkt war hierbei die durch Shuttleworth bereits 1909 dokumentierte Assoziation des Downsyndroms mit dem mütterlichen Lebensalter (4). Seit der Publikation von Tijo et al. im Jahre 1956 (5) war bekannt, dass die genetische Information in der menschlichen Zelle physiologischerweise bei Zellteilung in 2x23 = 46 Chromosomen aufgeteilt ist. Damit stellt das Vorhandensein von 46 normal strukturierten Chromosomen die Matrix der zytogenetischen Gesundheit (Euploidie) dar. Diese Erkenntnis überrascht insoweit, als dass der nächste genetische Bruder des Menschen, der Schimpanse, sein genetisches Material in 48 Chromosomen portioniert. Nachdem so die zytogenetische Basis der Euploidie definiert war, nimmt es nicht weiter Wunder, dass bereits drei Jahre später durch Lejeune der Nachweis eines zusätzlichen akrozentrischen Chromosoms (freie Trisomie 21) als häufigste zytogenetische Ursache des klinischen Bildes eines Downsyndroms identifiziert werden konnte (6). Andere Pathomechanismen, welche klinisch ein Downsyndrom verursachen können, konnten in der weiteren Folge rasch identifiziert werden. Hierzu zählen die Non-Disjunction (Lejeune 1959), die Translokation (7) und die Mosaikbildung (8). Ein weiterer wichtiger Meilenstein hin in der Entwicklung der Pränatalmedizin war die ab 1966 verfügbare Möglichkeit, die präntale Diagnose einer freien Trisomie 21 aus in Kultur gebrachte Amniozyten zu stellen (9). Die ersten großen Amniozentese-Studien aus den USA Ende der 60er Jahre und die deutsche Studie Mitte der 70er Jahre konnten auf eindrucksvolle Weise die Validität der dieser Methode unter Beweis stellen. Auch konnten hierdurch erstmals intrauterine Prävalenzen (d.h. Risken) für das pränatale Vorliegen des Downsyndroms in Abhängigkeit vom Schwangerschaftsalter empirisch bestimmt werden. In Verbindung mit der Kenntnis der mütterlichen Altersabhängigkeit des Downsyndrom-Risikos bei Geburt war es so möglich, Downsyndrom-Risiken für jede Schwangerschaftswoche in Abhängigkeit vom maternalen Lebensalter abzuschätzen: Das sogenannte Ausgangs- oder Hintergrundrisiko für Downsyndrom konnte erstmals bestimmt werden. Wichtig ist es an diesem Punkt festzustellen, dass diese Information sich auf alle Schwangeren gleichen Lebensalters und gleichen Schwangerschaftsalters bezieht: Damit handelt es sich beim sog. Alterstrisiko um eine unspezifische, weil nicht die individuellen Merkmale einer individuellen Schwangerschaft erfassende Form der Risikobetrachtung. In der sich hieran anschließenden Diskussion, welcher Schwangeren eine derartige Untersuchung angeboten werden sollte, griff man auf den damaligen Wissensstand zurück, welche identifizierbare Gruppen

Schwangerer ein erhöhtes Risiko für das Vorliegen eines Downsyndroms tragen: Dies waren die erkennbar älteren Schwangeren. Als Grenzziehung (Cut off) wurde dasjenige mütterliche Alter gewählt, bei welchem 5% aller Schwangeren im Endeffekt über eine Amniozentese getestet werden würden. Die Wahl auch dieser Größe ist historisch bedingt. Sie spiegelt die damalige Kapazität genetischer Labore für die zytogenetische Analyse aus Amniozyten wider. In den 70er Jahren waren 5% aller Schwangeren in westlichen Ländern 35 Jahre und älter. Folgerichtig wurde dieses Alter als Grenze definiert, ab welcher eine invasive Diagnostik durch die Frauenärzte angeboten werden sollte. 1972 beschrieben Brock und Sutcliffe erstmals die in Amnionflüssigkeit nachweisbare Assoziation von erhöhtem AFP mit dem intrauterinen Vorliegen einer Spina bifida (10). Durch die gleiche Arbeitsgruppe konnte dann 1973 belegt werden, daß auch in einem Teil der Fälle im mütterlichen Serum die AFP-Konzentrationen erhöht waren. 1976 wurde durch Nicholas Wald, Howard Cuckle und David Brock das AFP-Screening im mütterlichen Serum als Suchtest auf eine fetale Spina bifida in Großbritannien eingeführt. Um eine Vergleichbarkeit der mit unterschiedlichen Laborbestimmungsmethoden gemessenen AFP-Werte zu erreichen, wurde das Konzept der MoM´s (Multiple of Median) eingeführt (11, 12): Hierbei wird bei jeder Bestimmungsmethode der individuell gemessene, patientenspezifische absolute AFP-Wert auf den Populations-Median des jeweiligen SS-Alters bezogen. Durch diesen Kunstgriff werden mit unterschiedlichen Meßmethoden bestimmte AFP-Absolutwerte miteinander messmethoden-unabhängig vergleichbar, da nicht mehr der gemessene Absolutwert betrachtet wird, sondern das Verhältnis dieses Wertes zum Median der benutzten Meßmethode. Per Definition liegt damit der Medianwert einer Bestimmungsmethode bei Einlingen bei 1 MoM. Damit war eine wirkungsvolle Normalisierungs-Einheit generiert, die Absolutwerte unterschiedlicher Meßmethoden miteinander vergleichbar machte. Die Anwendung des Prinzips der MoM´s wurde in den Folgejahren auf alle pränatalmedizinischen Laborparameter ausgeweitet. Damit wurden die MoM´s zur einfachen und methodenunabhängigen „Währung“ in der Pränatalmedizin weltweit. 1984 gelang praktisch zeitgleich der Arbeitsgruppe um Howard Cuckle und Nicholas Wald (13) und der Arbeitsgruppe um Irwin Merkatz (14) der Nachweis, dass sich AFP im maternalen Serum bei Down-Syndrom durchschnittlich leicht erniedrigt findet: Der Median der Feten mit Downsyndrom liegt im Verhältnis zum Median der zytogenetisch Gesunden im ersten Trimester (11-13 SSW) bei 0,86 MoM und im zweiten Trimester bei 0,74 MoM (15). Es konnte berechnet werden, dass ein Cut off mit 5% Test-positiv-Rate bei gesunden Feten zu einer Downsyndrom-Detektionsrate von 25% führen würden. In zeitlich kurzer Abfolge wurde durch Folgeuntersuchungen nachgewiesen, dass bei Feten mit Down-Syndrom das unkonjungierte Östriol (uE3) ähnlich wie das AFP leicht erniedrigt und das Gesamt-ßHCG bei Downsyndrom durchschnittlich auf das Doppelte (2,0 MoM) erhöht ist. Rasch kam es zur Entwicklung des Triple-Tests: 1987 publizierten Howard Cuckle und Nicholas Wald in einer Metaanalyse eine aus den gepoolten Daten kalkulierte Gleichung zur Berechnung Hintergrund (=Alters-) Risikos für Down-Syndrom (16). Im gleichen Jahr wurde von Glenn Palomaki und James Haddow eine Methode veröffentlicht, mit welcher es von nun an möglich war, aus der Kenntnis individuell im mütterlichen Blut bestimmter Parameter sog. Wahrscheinlichkeitsquotienten (WQ, „likelihood ratio“) für das Vorliegen eines an

Downsyndrom erkrankten Feten abzuleiten. Das Prinzip dabei ist: Es lässt sich eine Gaußsche Normalverteilung für 'normale' and 'abnormale Gruppen definieren. Für jede gemessene Analysengröße wird die Wahrscheinlichkeit der Zugehörigkeit in eine der beiden Gruppen als Quotient berechnet. Damit war es erstmals möglich, eine sog. individualisierte Risikoberechnung für das mutmaßliche Vorliegen eines Downsyndroms zu berechnen (17). Das Prinzip des Triple-Tests als computerassistierte Risikokalkulation wurde 1988 aus diesen Arbeitsgruppen heraus publiziert (18). Dabei wird im Zeitfenster 15.-17. SSW bei einer individuellen Schwangerschaft das Hintergrundrisiko nach Cuckle bestimmt und für AFP, HCG, uE3 die Konzentration im mütterlichen Serum in MoM gemessen. Diese Konzentrationen werden in Häufigkeitsverteilungskurven eingesetzt, die im Wesentlich von Nicholas Wald als Gauß-Verteilungskurven für Gesunde und am Down-Syndrom erkrankte Feten entwickelt wurden. Hieraus werden nach dem Prinzip von Palomaki und Haddow drei Wahrscheinlichkeitsquotienten (WQ) gebildet, mit welchen das maternale Hintergrundrisiko nach dem Prinzip des sequentiellen Screenings multipliziert wird. Es resultiert hieraus ein sog. angepasstes, adjustiertes Risiko. Dieses wird mathematisch als Bruch angegeben. Dabei wird die Wahrscheinlichkeit, ein an Downsyndrom erkranktes Kind zu tragen, im Zähler angegeben. Im Nenner wird die Wahrscheinlichkeit dafür ausgewiesen, ein zytogenetisch gesundes Kind zu tragen. Eine Punktionsindikation ergibt sich dann, wenn das so berechnete adjustierte Risiko höher ist als das Downsyndrom-Risiko einer 35-Jährigen zum Zeitpunkt der Geburt.

Diese Gesamtperformanz (Sensitivität 60%, Falsch-positiv-Rate 5%, PPV 2%) dieses Zweittrimestertests war erstmals klinisch relevant. Folgerichtig wurde er Anfang der 90er Jahre in breiter Front in der Pränatalmedizin eingeführt und galt bis zur Jahrtausendwende als Goldstandard der nichtinvasiven Suche nach Vorliegen eines Downsyndroms. Rasch zeigten sich aber auch die Schwächen des Tests: Die Diagnosestellung im Falle eines auffälligen Testergebnisses kommt mit 17 bis 18 SSW spät. Der Test überprüft nicht die Validität des angegebenen Schwangerschaftsalters. Damit fallen die tatsächlichen Testleistungszahlen hinter den theoretisch zu erwartenden Werten zurück. Es handelt sich beim Tripletest um einen reinen Labortest. Eine Schulung der Gynäkologen in der Interpretation des Testergebnisses war nicht vorgesehen und führte häufig zu Fehlberatungen. Diese Faktoren bewirkten, dass der Tripletest (zu unrecht) trotz seinen eigentlich eindrucksvollen Leistungszahlen in Verruf geriet.

Hier setzte in den 90er Jahren die Arbeitsgruppe um Nicolaides an: Fußend auf den Erfahrungen des Triple-Tests wurde dieser unter Beseitigung der identifizierten methodischen Schwächen zu einem biochemisch-sonographischen Test am Ende des ersten Trimenons weiterentwickelt.

- Der Algorithmus ist einfach: Das NT-Screening nach Nicolaides verwendet im Prinzip den bekannten Algorithmus des Triple-Tests. Ausgangsgröße der Risikokalkulation ist wie beim Triple-Test das maternale Hintergrundrisiko. Anstelle der Bildung der Wahrscheinlichkeitsquotienten (WQ) durch die Messung von AFP, uE3 und Gesamt-ßHCG werden hier ebenfalls drei Wahrschenlichkeitsquotienten aus der Betrachtung von Häufigkeitsverteilungskurven gesund versus krank, diesmal der fetalen Nackentransparenz (NT), Papp-A und freiem ßHCG gebildet. Diese werden in identischer Weise wie beim Triple-Test mit dem Hintergrundrisiko nach dem Prinzip des sequentiellen Screenings gemäß dem Bayes-Theorem (Posterior odds = Prior odds x LR, Down’s odds = Age related odds x LR) multipliziert. Wie beim Tripletest ist auch hier die Resultante ein adjustiertes Risiko. Dies wird ebenfalls gegen das Altersrisiko einer 35-jährigen Frau verglichen. Übersteigt das adjustierte Risiko das Risiko einer 35-jähigen Frau, so wird der Test als „auffällig“ gewertet und aus dem Testergebnis eine Punktionsindikation abgeleitet.

Diese Gesamtperformanz (Sensitivität 90%, mittlere Falsch-Positiv-Rate 5%, PPV 8%) dieses Ersttrimestertests war klinisch hochrelevant. Folgerichtig wurde er Anfang der 2000er Jahre in breiter Front in der Pränatalmedizin eingeführt und löste rasch den Triple-Test als Goldstandard der nichtinvasiven Suche nach Vorliegen eines Downsyndroms ab.

- Ohne Verstehen des Algorithmus sind die generierten, adjustierten Risiken dem Fachmann nicht erklärlich und damit in der Aussagekraft der Patientin nicht plausibel vermittelbar:

Nur wer die Logik der Generierung des adjustierten Risikos versteht und die bei der Risikokalkulation hinterlegten Häufigkeitsverteilungskurven in ihrer Auswirkung grob kennt, begreift, was die generierten Zahlen eigentlich aussagen und richtig beraten.

Dies trifft insbesondere bei schwierig interpretierbaren, z.B. „grenzwertigen“ Ergebnissen und in der Beratung der älteren Schwangeren zu. Insoweit sind Schulungs- und Anwendungskonzepte, die den Kalkulationsalgorithmus aus Unkenntnis oder Vorsatz nicht offenlegen, dem Grunde nach abzulehnen, denn diesen Schulungen fehlt als zentrales Element die Vermittlung des intellektuellen Verständnisses für die softwareseitige Generierung der adaptierten Risiken.

- Der Algorithmus benutzt mathematisch geglättete Metadaten, die ihrerseits von in Kohortenstudien gewonnenen Stammdaten abgeleitet sind:

Vereinfacht gesprochen, handelt es sich bei diesen „Metadaten“ um nichts anderes als Häufigkeitsverteilungskurven. Diese wurden dadurch generiert, dass ursprünglich in Einzel- und Multicenterstudien die Häufigkeiten des Merkmals mütterliches Alter, NT, Papp-A und freies ßHCG bei gesunden und kranken (= vom Downsyndrom betroffenen) Feten empirisch beobachtet wurden. Hieraus wurden mathematisch geglättete, gemittelte Häufigkeitsverteilungskurven kalkuliert: Diese unterscheiden sich je nach Autor lediglich in Nuancen des Graphs der Kurven. Diese je nach Autor nur minimale Differenz der publizierten Häufigkeitsverteilungskurven verwundert nicht weiter, da sie biologische Grundgegebenheiten mehr oder minder präzise widerspiegeln. Im Folgenden werden einige Quellen angegeben, deren Daten sich auf hohe Fallzahlen beziehen. Damit ist die Validität dieser Kurven in der Abbildung der realen Zusammenhänge hoch. In der Praxis sind sie faktisch austauschbar. Die Auswirkung der Anwendung unterschiedlicher Kurven bei dem gleichen Algorithmus wird in den folgenden Absätzen erörtert. Bei der Ermittlung des alterspezifischen Hintergrundrisikos finden sich u.v.a.m. als Quellen die Daten von Cuckle und Wald (19) und die Daten von Frau Snijders aus der Nicolaides-Arbeitsgruppe (20). NT-Häufigkeitsverteilungskurven wurden von der Nicolaides-Arbeitsgruppe (21, 22) und von der Arbeitsgruppe um Schuchter und Wald (23) publiziert. Papp-A-Häufigkeitsverteilungskurven finden sich bei Wald, Brambati und Hackshaw (24, 25, 26). Die höchsten publizierten Zahlen bei der Ermittlung der Häufigkeitsverteilungskurven für das freie ßHCG finden sich bei Spencer und Macri (27) und Wald (28).

Risikokalkulationssoftware-Variante 1: Die Original-Nicolaides-Software Die Original-Nicolaides-Software (ONS) wurde im Jahr 1998, in Kombination mit Biochemie 2000 vorgestellt. Sie ist die erste der bisher verfügbaren 3 Software-Varianten und gilt unverändert als Bezugsgröße beim Vergleich der Testleistungszahlen unterschiedlicher Verfahren der individualisierten Risikoermittlung am Ende des ersten Trimenons. Die Testleistungszahlen wurden in diversen Multicenterstudien ermittelt (22) und überprüft (29, 30, 31, 32): Das Verfahren weist eine Sensitivität von 90% für die Detektion des Downsyndroms auf bei einer mittleren Test-Positiv-Rate bzw. mittleren Falsch-Positiv-Rate von 5%. Der positive Vorhersagewert beläuft sich auf ca. 8%. Die ONS ist in drei (hinsichtlich des konkret zugrundeliegenden Kalkulationsalgorithmus zueinander identischen) Varianten erhältlich:

1. ONS als alleiniges NT-Modul 2. ONS-NT-Modul als Bestandteil der Ultraschall-Dokumentations-Software

„Viewpoint®“ der Firma GE (früher „PIA Fetal Database®“) 3. ONS-NT-Modul als Bestandteil der Ultraschall-Dokumentations-Software

„Astraia®“ der Firma Astraia Im Umgang mit der Software finden sich einige, hinreichend bekannte Eigenheiten: Der Algorithmus wurde in seiner Gänze nie vollständig publiziert. Dies trifft insbesondere auf die Methode (=hinterlegte Häufigkeitsverteilungskurven) zu, nach welcher die Wahrscheinlichkeitsquotienten (WQ) der Biochemie berechnet wird. In den letzten Jahren gab es in sich verschiedene Versionen (Releases) der ONS. Worin diese sich tatsächlich unterscheiden, bleibt unklar. Laut Verlautbarung der FMF London wurden die zugrundegelegten Häufigkeitsverteilungskurven fußend auf der sich systembedingt immer weiter steigernden Datengrundlage fortwährend angepasst: Dies bedeutet, dass die publizierten Testleistungszahlen die gegenwärtige Leistungskraft der aktuellen Version nicht exakt widerspiegeln. Streng genommen hätte zur Ermittlung dieser Information für jede ONS-Version eine erneute retro- und prospektive Evaluationsstudie erfolgen müssen. In Kenntnis des zugrundeliegenden Algorithmus und der Testleistungszahlen der beiden anderen Varianten ist allerdings davon auszugehen, dass die in der ONS vollzogenen Anpassungen einen allenfalls marginalen klinischen Effekt auf die Testperformanz haben dürften. Die Nutzung der ONS ist in ein umfassendes Qualitäts-Management-Konzept eingebunden. Ziel dabei ist, einen möglichst hohen Grad der Standardisierung zu erreichen und gleichzeitig Fehlerquellen so gering als möglich zu halten. Dies erfolgt auf sonographischer Ebene (eigentliche NT-Messung) nach folgendem Prinzip: Voraussetzung zur Nutzung der ONS ist die Teilnahme an einer FMF-akkreditierten Schulung (Theoretischer Kurs mit Ablage einer theoretischen Prüfung, praktische Übungen mit praktischer Prüfung, Vorlage von ursprünglich 50, seit 2003 in Deutschland nur noch 5 NT-Messungen). Die erfolgreiche Teilnahme an dieser Fortbildungsmaßnahme qualifiziert zur kostenlosen Nutzung der ONS für ein Jahr. Im Anschluß hieran wird durch die statistische Überprüfung der Meßwertverteilung der

NT-Messungen des individuellen Untersuchers und der Vorlage von erneut 5 NT-Messungen (Videoprints) ein „Audit“ genanntes Rezertifzierungsverfahren durchlaufen. Der erfolgreiche Abschluß des Audits berechtigt (über die Zusendung eines Freischaltcodes) zur weiteren Nutzung der ONS. Wird die Rezertifizierung nicht durchgeführt, stellt die ONS bei Erreichen der Nutzungsberechtigung ihre Funktion ein. Für die Labore, welche das Papp-A und das freie ßHCG bestimmen, gelten analoge Regularien: Diese Laboratorien müssen ebenfalls eine FMF-Zertifizierung erwerben. Details hierfür sind in der sogenannten „Declaration of Conformity“ für Laboratorien festgehalten. Wesentliche Bestandteile sind die ausschließliche Verwendung des von der FMF zertifizierten Analysesystems „Kryptor“ der Firma Brahms, Teilnahme an Ringversuchen (UK-NEQAS), die Mitteilung von Risiken basierend auf Ersttrimester Biochemie allein sowie die Beschränkung der Mitteilung von Risiken basierend auf Nackentransparenz und Ersttrimester-Biochemie nur an von der FMF-London zertifizierte Ultraschalldiagnostiker. Ein Verantwortlicher des Labors muss an einem theoretischen Kurs teilgenommen haben. Durch dieses Regelwerk von Zertifizierung und Rezertifizierung sowie die zwingende Festlegung der Labore auf eine Analysemethode wird medizinisch folgendes erreicht: In Ring- und Vergleichsversuchen unterliegen die Laborergebnisse für Papp-A und freies ß-HCG einer sehr geringen Meßschwankung. Damit besitzen diese Bestimmungen ein hohes Maß an Reliabilität (Messgenauigkeit) und der Objektivität (Beobachterübereinstimmung) als Maßstab für die Gültigkeit einer wissenschaftlichen Feststellung. Auf der Ebene der eigentlichen NT-Messung (Sonographie) konnte trotz intensiver Bemühungen nicht ein zur Laboranalytik vergleichbares Niveau an Reliabilität (Messgenauigkeit) und Objektivität (Beobachterübereinstimmung) erreicht werden. Dies hängt damit zusammen, daß die Ultraschallgeräte, welche sich generell zur NT-Messung eignen, nicht definiert sind. Auch fehlen Standards, welche Presets an den Ultraschallgeräten bei der NT-Messung verwendet werden sollten. Der Fet selbst trägt durch die bewegungsbedingte Variabilität der NT-Ausdehnung (trotz Messanleitung, in einer intermediären fetalen Haltung zu messen) und die Dimension der NT, die im Zehntel-Millimeter-Bereich gemessen wird, maßgeblich dazu bei, daß selbst bei wiederholt am gleichen „gefreezten“ Ultraschallbild eine Meßschwankung von 0,2 bis 0,3 mm, mithin ein Unschärfebereich von 0,4 bis 0,6 mm nicht unterschritten werden kann. Der gewichtigste Faktor, welcher zur NT-Messunschärfe beiträgt, ist dabei allerdings der Untersucher selbst. Dies beruht auf zwei Ursachen, von welchen nur eine (Anwendung einer grob fehlerhaften, in der B-Bild-Darstellung klar erkenntlichen Methodik wie zu geringe Bildvergrößerung, fetale Beugung oder Überstreckung, offensichtliche Schrägschnitteinstellung) durch Schulung und Rezertifizierung beeinflusst werden kann: Das, was die zweidimensionale Darstellung der NT auf dem Monitor des Ultraschallgerätes oder als Bildausdruck (Videoprint) liefert, ist nicht ein in der üblichen Wahrnehmung unterstelltes unendlich schmales, längs gelegtes Schnittsegment durch den Feten. Vielmehr besitzt diese 2D-Darstellung eine räumliche Tiefe durch Superposition mehrer eng nebeneinander befindlicher Abbildungsebenen. Dies bedingt, daß auch tatsächlich leicht paramedian gelegte Schnitte die im 2D-Bild geforderten sonographischen Gütekriterien der NT-Messung

zu liefern vermögen. Dies kann anschaulich bei der NT-Einstellung von Volumina im Ultraschall-Simulator belegt werden: Hier ist es durch die simultane Darstellung der drei senkrecht aufeinander stehenden Abbildungsebenen (3D) und der bei der Einzeluntersuchung tatsächlich gewählten Ebene (2D) möglich, zu überprüfen, inwieweit die vom Untersucher gewählte Messebene mit der postulierten Mediansagittalebene übereinstimmt: Da die NT nicht nur in der Längs- sondern auch in der Querdarstellung („cross-sectional view“) eine räumliche Ausdehnung besitzt, ist es durchaus möglich, bei exakter sonographischer Anlotung der vorderen fetalen Bauchwand im Bereich des rückwärtigen Kopf-Nacken-Bereiches ohne Verlust ihrer Darstellbarkeit die NT auch paramedian einzustellen. Insoweit muß auf medizinischer Ebene der Versuch der FMF London, die Nutzung der ONS ist in ein umfassendes Qualitäts-Management-Konzept einzubinden mit dem Ziel, einen möglichst hohen Grad der Standardisierung zu erreichen und gleichzeitig Fehlerquellen so gering als möglich zu halten, als auf Laborebene erreicht gewertet werden. Ob und inwieweit auch andere Bestimmungsmethoden für Papp-A und freies ßHCG ähnlich objektive und reliable Ergebnisse zu liefern imstande wären, bleibt unklar, da es hierzu nur wenig Vergleichsstudien gibt (33). Auf sonographischer Ebene ist dieses Ziel der Messfehlerminimierung, welche den statistischen Anforderungen der Risikokalkulation tatsächlich genügen würde, bedingt durch die oben geschilderten Limitationen praktisch nicht erreichbar. Von daher muß die medizinische Berechtigung dieses Systems der Qualitätskontrolle für den sonographischen Part kritisch hinterfragt werden. Aufgrund der in der ONS fehlenden Transparenz der kalkulatorischen Grundlagen, insbesondere im Bereich der Biochemie, und der infolgedessen in den Schulungskonzepten der FMF zwangsläufig fehlenden Darstellung des Risikokalkulationsalgorithmus ergibt sich für den ärztlichen Anwender im klassischen Nicolaides-Konzept die intellektuell, aber auch praktisch unbefriedigende Situation, mit in Zahlen ausgedrückten Wahrscheinlichkeiten in der Beratung der Patientinnen umgehen zu müssen, ohne dabei ein Verständnis der Plausibilität hinsichtlich der generierten Zahlen zu besitzen.

Risikokalkulationssoftware-Variante 2: NT-Modul der JOY-Software (NT/Joy) Diese eben geschilderten intrinsischen Schwächen des klassischen Nicolaides-Konzeptes waren der Ausgangspunkt zur Entwicklung des NT-Moduls der Joy-Software im Jahre 2002. Diese benutzt denselben Algorithmus wie die Nicolaides'sche Methode (Prinzip des sequenziellen Screenings [34] mit Ermittlung des testspezifischen Wahrscheinlichkeitsquotienten (WQ) nach dem Prinzip der Likelihood method [17]). Als Datenbasis zur Ermittlung des Hintergrundrisikos dienen die aus der Nicolaides-Arbeitsgruppe von Snijders 1999 publizierten Tafeln [35]. Als Grundlage der NT-Nor-malverteilung werden die von Nicolaides publizierten Normkurven benutzt [21]. Bei der Ermittlung des NT-Wahrscheinlichkeitsquotienten wird auf das Prinzip und die Daten zurückgegriffen, welche von der Nicolaides-Arbeitsgruppe in der zweiten britischen Multizenterstudie 1998 publiziert wurden [22]. Bei der Ermittlung der biochemischen Wahrscheinlichkeitsquotienten dienen die publizierten Daten von Wald und Hackshaw [26] als Datenbasis. Insgesamt greift JOY damit ausschließlich auf publizierte und wohlevaluierte Daten von hohen Fallzahlen zurück. Das NT-Modul der Joy-Software (NT/Joy) benutzt im Vergleich zur ONS den identischen Risikokalkulationsalgorithmus. Es ist, wie weiter oben beschrieben, die ONS- Datengrundlage (=tatsächlich im Kalkulationsalgorithmus hinterlegte Häufigkeitsverteilungskurven für die Bestimmung der Wahrscheinlichkeitsquotienten bei NT, Papp-A und freiem ß-HCG) nie synoptisch dargelegt bzw. publiziert worden. Es darf allerdings davon ausgegangen werden, daß die Nicolaides-Arbeitsgruppe tatsächlich ihre eigenen publizierten Daten im ONS-Kalkulationsalgorithmus benutzt. Diese finden sich für das NT-Modul der Joy-Software jedenfalls bei der Berechnung des Hintergrundrisikos und der WQ für die NT-Messung hinterlegt. In einer initialen Vergleichsstudie wurden bei der alleinigen Analyse der NT-WQ´s für die ONS und für das NT/Joy in allen untersuchten Fällen identische Werte gefunden (36). Dies ist der indirekte Beweis für die identische Datengrundlage beider Software-Varianten bei der Ermittlung des Hintergrundrisikos und des NT-Risikos. Während die ONS bei der Ermittlung der WQ´s (Häufigkeitsverteilungskurven) für Papp-A und freiem ß-HCG auf die hauseigenen Spencer-Daten zurückgreift, unterscheidet sich hier die NT/Joy: Sie benutzt die Daten von Nicholas Wald. Es handelt sich damit hinsichtlich der Validität und Reliabilität der zugrundegelegten Daten bei beiden Software-Varianten für den Bereich der Biochemie um diejenigen, welche international die höchste Fallzahl und damit das größte klinische Gewicht aufweisen: Beide hinterlegte Graphpaare der Häufigkeitsverteilung für Papp-A und freiem ß-HCG unterscheiden sich lediglich in der Feingestaltung der aus den Rohdaten abgeleiteten, geglätteten Kurven. Dieser Unterschied auf Ebene der Biochemie führte als klinische Auswirkung in der ersten Vergleichsanalyse aus dem Jahr 2003 dazu, daß bei identischer Testsensitivität die Falsch-positiv-Rate unter Verwendung von NT/Joy um mit 6,4% versus 7,94% um 18% (ein fünftel) niedriger lag als bei Verwendung der ONS: Offenbar bilden die Wald-Kurven die tatsächlichen biologischen Zusammenhänge zwischen dem Vorliegen eines Downsyndroms und den Veränderungen bei Papp-A

und freiem ß-HCG minimal besser ab, was zu diesem Phänomen der im Vergleich zur ONS statistisch hochsignifikanten und klinisch hochrelevanten besseren Testspezifität und verbessertem positivem positiven Vorhersagewert (PPV) bei NT/Joy führt. In einer Folgestudie (37) an 1463 untersuchten Fällen erhärtete sich dieser Trend: Hier wurde an der untersuchten Kohorte für beide Programme eine identischen Sensitivität ermittelt. Die Spezifität lag bei NT/Joy mit 96,06 % um 1,5 Prozentpunkte höher als unter Verwendung der ONS. Der positive Vorhersagewert bei NT/Joy stieg im Vergleich zur ONS von 14,13 auf 18,57%. Auf der Ebene der Falsch-Positiv-Rate (= Rate an ex post unnötigen Interventionen) fand sich für NT/Joy im Vergleich zu ONS eine Senkung um 23,9%. Diese Ergebnisse sind mittlerweile an mehr als 10.000 durchgeführten kombinierten NT-Tests überprüft und bestätigt worden. Diese Daten stehen gegenwärtig zur Publikation an. Das Schulungs- und Auditkonzept der NT/Joy-Software verfolgt das Prinzip des kompakten Wissenserwerbs in entsprechenden NT-Kursen. Grundansatz und Grundanspruch (vor dem Hintergrund der gesetzlich vorgegebenen Dokumentationspflicht) ist die Selbstverantwortlichkeit des einzelnen Frauenarztes für sein sonographisches Handeln (NT-Messung). Dadurch, daß in den NT-Kursen der Kalkulationsalgorithmus vermittelt wird, ist der einzelne Frauenarzt befähigt, die Bedeutung seiner Tätigkeit begrifflich zu fassen und richtig zu werten. Es besteht jederzeit die Möglichkeit, auf freiwilliger Basis sich einer internen Qualitätskontrolle (Verteilung der NT-Messwerte) und auch einem externen Audit zu unterziehen. In den Jahren seit Einführung der Software 2003 wurden mehr als 2000 Gynäkologen nach diesem Konzept geschult.

Risikokalkulationssoftware-Variante 3: PRC-Software der FMF Deutschland Im Herbst 2006 kam es zu einer Trennung der FMF-Deutschland von der FMF London. Damit war die FMF -Deutschland gezwungen, eine eigene Softwarelösung für die individualisierte Risikokalkulation auf fetale Aneuploidien anzubieten. Entsprechend wurde von der FMF-Deutschland im Februar 2007 ein weiteres Computerprogramm mit Namen „Prenatal Risk Calculation“ (PRC®) vorgestellt [38, 39]. Anders als in der FMF-England-Lösung und in der JOY® Software wurden hier erstmals völlig neue Rechenalgorithmen eingesetzt. So wurde ein Vorgehen nach dem Bayesischen Theorem gewählt, statt wie bisher nach dem Konzept der Likelihood ratios nach Palomaki & Haddow. Zusätzlich wurde ein komplett neues Vorgehen in der Bewertung der biochemischen Parameter auf der Basis sogenannter „Degrees of Extremeness“ (DoE) eingeführt. Das alles erfolgte auf der Grundlage völlig neuer statistischer Daten. Diese fußen im Wesentlichen auf den Daten des FMF-Labors Enders in Stuttgart. In einem Rundschreiben dieses Labors vom 2.Oktober 2007 wird hierzu ausgeführt: „....... Folgende Neuerungen sind mit der Einführung von PRC verbunden:

1. Einführung sog. „DoE“-Werte 2. Einführung des bislang unüblichen Grenzwertes von 1:230 3. Ausweisung eines Grenzbereiches (gelb gekennzeichnet) zwischen 1:230 und

1:1100 4. Fehlende Korrektur hinsichtlich Gewicht, Raucherstatus und Ethnizität

Ad 1: DoE-Werte Seit Einführung von PRC erhalten wir viele Anfragen bezüglich der Vergleichbarkeit der DoE-Werte mit den bekannten MoM-Werten. .... Ad 2.: Grenzwert 1:230 Als Begründung für den in der PRC-Software gewählten Grenzwert von 1:230 wurde von der FMF Deutschland ein ansonsten zu hohe Positivenrate genannt. Wir haben daruf die Positivrate in unserem Labor bei einem Cut off von 1:230 mit derjenigen bei 1:300 verglichen. Ergebnis: Bei 1:230 liegt die Positivrate in PRC bei nur 3,7% und somit relativ niedrig. Durch die Absenkung auf 1:300 erhöht sich die Positivrate auf akzeptable 4,3% (von der FMF London werden für das Ersttrimesterscreening 5% empfohlen). Gleichzeitig steigt aber die Erkennungsrate von 88,5 auf ca. 92% an! Wir haben uns daher entschlossen, den Grenzwert (Cut off) in PRC dem international üblichen Standard von 1:300 anzupassen. Bei der Bewertung der zweifelsfrei hohen Erkennungsrate von 92% muß berücksichtigt werden, daß in die Entwicklung des Algorithmus der PRC Software ein

Großteil der hier ausgewerteten Trisomie-21-Schwangerschaften unseres Labors eingeflossen sind. Es bleibt also abzuwarten, wie sich die Erkennungsraten für neu aufgetretene Fälle im Vergleich darstellen wird. Hierzu wird voraussichtlich erst in gut einem Jahr eine Aussage möglich sein. ......“

Versuch der Testfortentwicklung- Nasenbeinmessung

Nachdem mit dem Ultraschall-Marker „fetale Nackentransparenz“ ein potentes, weil hochempfindliches (hohe Sensitivität), aber nur wenig präzis in eine Richtung fetaler Pathologie weisendes (unspezifisches) Ultraschall-Merkmal gefunden worden war, lag es nahe, nach weiteren Ultraschall-Zeichen zu fahnden, die gehäuft bei Vorliegen eines Downsyndroms nachweisbar sind.

In Analogie zu der Verfeinerung der kalkulatorischen Vorhersage des kindlichen Gewichts durch die Hinzunahme weiterer biometrischer Maße wie z.B. bei der fetalen Gewichtsschätzung nach Shepard und Hadlock (40, 41, 42) lag es nahe, über eine Einschließung dieser neuen Ultraschallmarker in die als Goldstandard etablierte Risikokalkulation „Mütterliches Alter-NT-Biochemie (Papp-A und freies ß-HCG)“ die Testempfindlichkeit (Sensitivität) dieser Beurteilungslogik über die bereits erreichten 90% hinaus zu steigern. Diese Steigerung der Test-Sensitivität ist mithin das Prinzip, welches bis heute von den Meinungsführern in diesem Bereich der Pränatalmedizin als Ansatz einer Fortentwicklung des Tests „NT-Messung“ verfolgt wird. Der erste und prima vista potenteste sonographische Marker hierbei war der international als „Nasal Bone - NB“ bezeichnete fetale Nasenknochen: In der primär publizierten und von der Fachwelt weithin beachteten Untersuchung wurde festgestellt, daß 75% aller von Downsyndrom betroffenen Feten und nur 0,5% der zytogenetisch gesunden Feten das Ultraschall-Merkmal „fehlendes Nasenbein“ aufweisen (43). Hiervon wurde abgeleitet, daß bei nachweisbarem Nasenbein die Wahrscheinlichkeit dafür, daß der untersuchte Fet von einem Downsyndrom betroffen sein könnte, im Vergleich zu alleinigen klassischen kombinierten Nackentransparenzmessungs-Kalkulation um den Faktor 1/3 (=0,3) sinkt, umgekehrt bei fehlendem Nachweis um den Faktor 30 ansteigt. Weiters konnte biomathematisch berechnet werden, daß der Einschluß dieses Ultraschallmarkers in die kombinierte Testlogik die Testempfindlichkeit von 90% auf 93 bis 94 % ansteigen lassen würde. Folgeuntersuchungen bestätigten unter leichter Abschwächung der Diskriminationsschärfe des NB´s in der Risikozuweisung „gesund vs. Genetisch krank“ im Wesentlichen diese Ergebnisse: Etwa 70% der Downsyndrom-Feten und 2% der gesunden Feten weisen das sonographische Merkmal „fehlendes Nasenbein – absent NB“ auf (44). Das Ultraschall-Merkmal „nachweisbares Nasenbein“ bzw. „fehlendes Nasenbein“ leidet allerdings hierbei unter wesentlichen konzeptionellen wie methodischen Schwächen:

- Es handelt sich um einen rein qualitativen Marker (sonographisch nachweisbar-nicht nachweisbar). Dies wird sehr klar an der bisher ungelösten Frage, was denn wohl ein „hypoplastic nasal bone“ sei, illustriert

- Ein qualitativer Marker kann nur eine statische Risikozuweisung (fester Wahrscheinlichkeitswert) versus gesund oder krank treffen. Dies steht im Widerspruch zu dem bisherigen Prinzip, über die Quantifizierung (= Längenmessung) eine flexible, quantitative, individuelle Aussage (Prinzip der Bildung von Wahrscheinlichkeitsquotienten nach Palomaki und Haddow) für die Wahrscheinlichkeit zu treffen, genetisch gesund oder krank zu sein.

- Es sind für die qualitative Nachweisbarkeit keine verbindlichen Regeln auf Ebene der Geräte-Voreinstellung getroffen worden (Gain, Dynamic Range)

- Bei falscher Messebene (= fehlende Median-Sagittaleinstellung als Referenzebene) ist das Nasenbein regelmäßig nicht nachweisbar. Diese durch falsche Messtechnik häufige fälschliche Nicht-Nachweisbarkeit führt in praxi häufig zu einer drastischen inkorrekten Risikoerhöhung mit der Folge der Punktion: Der positive Vorhersagewert des Ergebnisses sinkt deutlich ab.

Jüngste Analysen (45, 46) konnten an prospektiv erhobenen Daten zur Nasenbeinmessung nachweisen, daß

- in etwa 25% die Beurteilbarkeit des Nasenbeins (unable to determine) generell nicht gegeben war

- die tatsächliche Sensitivität des Ultraschall-Markers „fehlendes Nasenbein – absent nasal bone“ im Erkennen einer fetalen Aneuploidie faktisch weitaus niedriger ist als in den Studien der primären Euphoriephase kommuniziert (Malone: Keine der im Untersuchungskollektiv beobachteten 11 Fälle von Downsyndrom wiesen beim Ultraschall das Merkmal: „fehlendes Nasenbein – absent nasal bone“ auf).

Diese Arbeitsgruppen schlußfolgern daher, daß die Integration des fetalen Nasenbeins als Marker im Ersttrimesterscreening kein Benefit für das Screening auf Aneuploidie erbringt. Mithin gilt in Bezug auf das Nasenbein:

• Es handelt sich beim Fetalen Nasenbein um einen prinzipiell potenten US-Marker für fetale Aneuploidien. Seine tatsächliche Bedeutung ist bisher nicht abschließend geklärt

• Es handelt sich beim Nasenbein um einen im Ultraschall schwierig einzustellenden Messwert. Daher sind Schulungen vor seiner Anwendung vonnöten

• Es ist nur bei sicherer, mediansagittaler Meßmethode beurteilbar • Die gängige qualitative Beurteilung ist für eine genauere Risikospezifizierung

bzw. Integration in FMF-Algorithmus ungeeignet Im Umgang mit dem Nasenbein ist von daher zu fordern:

• Die Anfang 2005 durch die FMF erfolgte Option, in die Risikokalkulation den qualitativen Nachweis des Nasenbeins zu inkludieren, muß umgehend zurückgenommen werden

• Eine Häufigkeitsverteilungs-Normkurven-Erstellung für genetisch gesunde und erkrankte Feten als epidemiologische Grundlage für eine individuelle Risiko-Quantifizierung ist dringend notwendig

• Dann sollte die klinische Evaluation eines um das quantifizierte = längengemessene Nasenbein erweiterten kombinierten NT-Test s erfolgen

Versuch der Testfortentwicklung- Ductus venosus-Messung

Bereits im Jahre 1998 wurde in einem Hochrisikokollektiv nachgewiesen, dass bei 90% der von einem Downsyndrom betroffenen Feten gegen nur 3% bei zytogenetisch gesunden Feten sich im Ductus venosus - DV als venösem Gefäßschenkel nahe vor dem Herzen qualitativ auffällige Flußmuster (negative A-Welle) nachweisen lassen (47). Für eine Politik, bei der nur diejenigen in der kombinierter NT-Testung auffällig getesteten Feten punktiert werden, welche auch einen auffälligen Flow im

Ductus venosus aufweisen, konnte berechnet werden, dass bei einem Rückgang der Gesamt-Testsensitivität von 90 auf 80% die Testpositiv (=Punktions-)Rate um den Faktor 10 von 5% auf 0,5% senkbar wäre. Folgeuntersuchungen bestätigten unter leichter Abschwächung der Diskriminationsschärfe des DV in der Risikozuweisung „gesund vs. Genetisch krank“ im Wesentlichen diese Ergebnisse: Etwa 83% der Downsyndrom-Feten und 5% der gesunden Feten weisen das sonographische Merkmal „absent or reverse enddiastolic Flow im DV“ auf (48, 49, 50, 51). Dennoch ist der Ductus venosus weder bisher noch in absehbarer Zukunft ein Parameter, welcher sich alltagstauglich in das Primärvorgehen bei einem erweiterten kombinierten NT-Test integrieren lässt:

- Die Messung setzt die Verfügbarkeit eines hochauflösenden Ultraschallgerätes mit schnellem und sensitivem (Farb-)Dopplermodul voraus

- Der Untersucher muß ein hohes Maß an Expertise in der praktischen Dopplersonographie am Ende des ersten Trimenons besitzen

- Es ist für eine Inter-Observer-Vergleichbarkeit (Objektivitiät und Reliabilität) keine hinreichende Standardisierung der Messebene, insbesondere des Messwinkels erfolgt

- Es handelt sich, wie beim Nasenbein, bisher um einen qualitativen Parameter mit der damit verbundenen statischen Risikozuweisung

In der angewandten NT-Messung hat der Ductus venosus dennoch eine praktische Bedeutung erworben: Solche Feten, die aufgrund einer auffälligen NT invasiv getestet wurden und einen unauffälligen Karyotyp besitzen, können über die Evaluation des Ductus-venosus-Flußverhaltens für die Wahrscheinlichkeit cardialer Defekte weiter risikostratifiziert werden: Zytogenetisch unauffällige Feten mit erhöhter NT und auffälligem Ductus venosus tragen eine hohe Wahrscheinlichkeit dafür, dass sie von einem Vitium cordis betroffen sind und sollten dementsprechend gezielt früh weiter echocardiographisch abgeklärt werden. Umgekehrt besitzen solche Feten für

den weiteren Schwangerschaftsverlauf ein günstige Prognose, welche aufgrund einer erhöhten NT punktiert wurden, ein zytogenetisch unauffälliges Ergebnis aufweisen und zusätzlich einen normalen Flow im Ductus venosus zeigen.

Versuch der Testfortentwicklung- Tricuspidalklappenmessung Eine zur Geschichte der Ductus-venosus-Messung analoge Entwicklung ist für die Tricuspidalklappenmessung (Tricuspidalklappeninsuffizienz als Marker für fetale Aneuploidien und Herzfehler) zu beobachten: Die Tricuspidalklappe weist bei solchen Feten, die von einer fetalen Aneuploidie und/oder einem organischen Herzfehler betroffen sind, gehäuft das dopplersonographisch nachweisbare Phänomen einer holosystolischen Regurgitation aus der rechten Kammer in den rechten Vorhof auf Bei etwa 67% der Downsyndrom-Feten und 5% der gesunden Feten lässt sich das sonographische Merkmal „Tricuspidalklappenregurgitation“ nachweisaen (52, 53). Dennoch ist der Nachweis einer vorhandenen oder fehlenden Trikuspidalklappenregurgitation weder bisher noch in absehbarer Zukunft ein Parameter, welcher sich alltagstauglich in das Primärvorgehen bei einem erweiterten kombinierten NT-Test integrieren lässt:

- Die Messung setzt die Verfügbarkeit eines hochauflösenden Ultraschallgerätes mit schnellem und sensitivem (Farb-)Dopplermodul voraus

- Der Untersucher muß ein hohes Maß an Expertise in der praktischen Dopplersonographie und obendrein der fetalen Echocardiographie am Ende des ersten Trimenons besitzen

- Es ist für eine Inter-Observer-Vergleichbarkeit (Objektivitiät und Reliabilität) keine hinreichende Standardisierung der Messebene, insbesondere des Messwinkels erfolgt

- Es handelt sich, wie beim Nasenbein und dem Ductus-venosus-Flußverhalten bei der Tricuspidalklappenmessung bisher um einen qualitativen Parameter mit der damit verbundenen statischen Risikozuweisung

Damit ist dieser intracardiale Dopplerparameter nicht als Aneuploidie-Ultraschallmarker in der praktischen Routine etablierbar. Ob sich, wie bei der Messung des Ductus venosus, in der Sekundärdiagnostik für die Trikuspidalklappenregurgutation eine Indikation finden lassen wird, bleibt abzuwarten.

Versuch der Testfortentwicklung- Risikoclusterung durch Bildung von Risikogruppen mit differenzierter weiterer Vorgehensweise In Anbetracht der Problematiken, welche die neuen sonographischen Aneuploidie-Parameter NB, DV und Trikuspidalklappenregurgitation auf der Ebene ihrer praktischen Durchführung und der statistisch-mathematischen Ebene ihrer Integration in einen praktikablen Risikokalkulationsalgorithmus in sich bergen, wurde von der Arbeitsgruppe um Nicolaides im Jahre 2005 propagiert, in der Beratungssituation auf der Information dieser Parameter fußend eine Risikotriage durchzuführen (54): Die kalkulierten, „adjustierte Risiken“ genannten individualisierten Risiken der kombinierten NT-Messung (Alter, NT und Biochemie) werden in drei Gruppen zusammengefasst

- Gruppe 1: Adjustiertes Risiko > 1:100 (Prävalenz: 2% aller NT-Messungen, hierin enthalten: 80% der tatsächlich in dem untersuchten Kollektiv vorhandenen Downsyndrom-Fälle)

- Gruppe 2: Adjustiertes Risiko 1:100 bis 1:1000 (Prävalenz: 16% aller NT-Messungen hierin enthalten: 15% der tatsächlich in dem untersuchten Kollektiv vorhandenen Downsyndrom-Fälle)

- Gruppe 3: Adjustiertes Risiko < 1:1000 (Prävalenz: 82% aller NT-Messungen hierin enthalten: 5% der tatsächlich in dem untersuchten Kollektiv vorhandenen Downsyndrom-Fälle)

In der Beratung wird gruppenabhängig folgende Vorgehensweise empfohlen: Gruppe 1: Hochrisikogruppe -> umgehende invasive Diagnostik Gruppe 3: Niedrigrisikogruppe -> keine weiteren diagnostischen Maßnahmen Gruppe 2: Intermediäre Risikogruppe -> Messung von NB oder DV oder Trikuspidalklappe. Wenn diese Messung auffällig ist -> Empfehlung der weiterführenden invasiven Diagnostik im Sinne der sekundären Zuordnung zu Gruppe 1. Bei unauffälligem Befund der sekundäre Zuordnung zu Gruppe 3. Hierdurch werden aus dieser Gruppe von 16% aller NT-Messungen 1% der Hochrisikogruppe und 15% der Niedrigrisikogruppe zugeordnet. Im Endeffekt senkt diese Vorgehensweise des geclusterten Vorgehens die Gesamt-Testpositivrate von 5% bei klassischem Vorgehen auf 3% bei unter Erhalt der Testsensitivität von 90%. Damit stellt diese Vorgehensweise (bei Vorhandensein der entsprechenden Meßexpertise durch den Untersucher und eines damit korrespondierenden Ultraschallequipments) eine in einem Ultraschallzentrum einfach durchzuführende Methode dar, um das Problem der vergleichsweise hohen Falsch-Positiv-Rate der kombinierten NT-Messung wirkungsvoll zu senken. Sie zielt auch nun erstmalig in die Richtung, welche zu verfolgen sich am meisten lohnt: Die Senkung der Falsch-Positiv-Rate und damit Steigerung der Test-Spezifität. Damit ist sie allerdings in Deutschland in praxi nicht flächendeckend anwendbar:

- Bei 12.000 niedergelassenen und 4000 in Kliniken tätigen Gynäkologen wird ein guter Teil der NT-Messungen in im Bezug auf den Ultraschall Nicht-Schwerpunktpraxen durchgeführt.

- Dort sind die für die NB-, DV-, Trikuspidalklappenmessung notwendigen personellen, apparativen und zeitlichen Voraussetzungen mehrheitlich nicht gegeben.

Generell ist es unter Gesichtspunkten der Qualitätssicherung für ein Testverfahren wichtig, dass die Testsstruktur, und hierzu zählt auch und gerade die sich aus der Beratung ergebende klinische Konsequenz (Punktion – Keine Punktion), einheitlich gehandhabt wird. Andernfalls kommt es zu einer heillosen Verwirrung, die im Endeffekt die Präzision der Testaussage verwässert. Die Folge der Umsetzung einer derartigen Politik wäre es, NT-Messungen nur noch in entsprechend geschulten Ultraschallzentren als Untersuchungsangebot zuzulassen, wo die nachgewiesene Expertise in der Nasenbein-, Ductus-venosus- und Nasenbeinmessung gegeben ist.

Fazit: Methodenschwäche der klassischen nichtinvasiven Ersttrimester-Suchverfahren auf fetale Aneuploidie und Versuch der Testfortentwicklung durch Steigerung der Sensitivität Alle dargestellten und sonst bisher entwickelten nichtinvasiven Suchstrategien sowohl des ersten wie des zweiten Trimenons weisen entscheidende methodisch-konzeptionelle Gemeinsamkeiten auf:

- Sie bauen in ihrer historischen Entwicklung aufeinander auf - Ausgangsbetrachtung all dieser Tests war und ist das unspezifische

mütterliche Altersrisiko für das Vorliegen einer fetalen Aneuploidie - Gemäß dem Prinzip der individualisierten Risikoadaptation durch

sequentielles Screening – Bildung von individualisierten Wahrscheinlichkeitsquotienten nach Palomaki und Haddow (17) werden spezifische (vom individuellen Kind der individuell ratsuchenden Schwangeren stammende) sonographische und biochemische Wahrscheinlichkeiten (=Risiken) mit dem unspezifischen mütterlichen Altersrisiko über eine Multiplikation verbunden

- Von der Testtheorie her wird also bei allen Tests ein unspezifisch-allgemeines mütterliches Altersrisiko mit spezifisch-kindlichen Risiken zu einem Mischrisiko verbunden. Dies ist logisch-statistisch-methodologisch nicht zulässig und damit dem Grunde nach falsch.

- Anspruch all dieser Tests ist es, eine individuelle Wahrscheinlichkeit für die individuelle fetale (nicht gemischt fetomaternale) Gesundheit anzubieten: Solange in diesen Kalkulationsalgorithmen allerdings eine allgemeine mütterlich determinierte Risikowahrscheinlichkeit mit eingeschlossen ist, können diese Tests ihrem idealen Anspruch nicht gerecht werden, denn: In den Algorithmen fungiert das mütterliche Altersrisiko im Hinblick auf das tatsächliche fetale Risiko als bedeutsame Störgröße (Sog. Test-CONFOUNDER). Dieses wirkt sich bei jungen Patientinnen in der Form aus, dass tatsächlich individuelle Risiken fälschlich zu niedrig eingestuft werden. Umgekehrt steigt mit fortschreitendem mütterlichen Alter die Risikoverzerrung hin in zu einer fälschlichen Hochrisikozuweisung an: Die Tests werden gerade bei den Patientinnen, die im Bewusstsein ihres Alters eine spezifisch kindliche Information wünschen, um unnötige invasive Prozeduren zu vermeiden, fälschlich zu häufig auffällig kalkuliert.

Bezüglich des Versuches, die Limitationen des kombinierten NT-Tests durch weitere sonographische Parameter zu verbessern, ist zu konstatieren: In der Bilanz ist die Politik, durch Hinzunahme weiterer sonographischer Parameter die Sensitivität des kombinierten NT-Tests zu steigern, als gescheitert zu betrachten. Dies ist allerdings nicht weiter verwunderlich, da ein 4-Parameter-Test (Mütterliches Alter, NT, Papp-A,

freies ß-HCG) mit einer bereits 90%igen Sensitivität ohne Verlust an Spezifität statistisch-mathematisch kaum weiter verbessert werden kann. Eine analoge Erfahrung wurde in der Pränatalmedizin bereits in den 80er Jahren beim Versuch gemacht, durch Ausweitung des Umfanges biometrischer Parameter die Präzision des fetalen Gewichtes zu steigern. Hier musste erkannte werden, dass die Steigerung der Kalkulationsalgorithmen über 4 Parameter hinaus nicht zu einer Steigerung der Präzision in der fetalen Gewichtsvorhersage führte. Die einzuschlagende Richtung kann hier nur lauten: Verbesserung der Testleistungszahlen durch Senkung der nach wie vor hohen Falsch-Positiv- (=Punktions-)Rate. Dieser Ansatz wurde im Prinzip des AFS - Advanced Firsttrimesterscreenings verwirklicht.

Erfolgreiche Testentwicklung- Advanced Firsttrimesterscreening (AFS) Heute besitzen wir zur Ermittlung eines individuellen Risikos für das Vorliegen eines Downsyndroms weitaus empfindlichere, weil direkt vom Kind kommende Informationen, die wir zu einem individuellen Bild zusammensetzen können. Die gemeinsame Analyse der Kritik an allen konventionellen Konzepten des nichtinvasiven Erst-Trimester-Screenings lautet: In den gängigen Risikokalkulationsalgorithmen dient unisono als Basis-Bezuggröße einer mathematischen individualisierten Risikokalkulation das aus dem allgemeinen mütterlichen Alter abgeleitete, unspezifische, sog. Hintergrundrisiko. Hiermit werden individuell gewertete Wahrscheinlichkeitsquotienten (WQ), d. h. spezifisch kindliche Informationen zu einem „individualisiert“ genannnten, in Wirklichkeit aber gemischten unspezifisch-spezifischen Risiko für das Vorliegen einer fetalen Aneuploidie miteinander nach einer logischen Handlungsvorgabe verbunden. Die Tatsache, daß die hinsichtlich ihrer Wirksamkeit gesicherten konventionellen Konzepte des nichtinvasiven Erst-Trimester-Screenings (Original-Nicolaides-Software, NT-Modul der Joy-Software) trotz des faktisch als bedeutsame Störgröße (sog. Test Confounder) funktionierenden „mütterlichen Altersrisikos“ dennoch als Instrumente hervorragend geeignet sind, in einer Niedrig-Risikopopulation mit hinreichender Testempfindlichkeit solche Schwangerschaften zu identifizieren, welche tatsächlich ein individuell erhöhtes Risiko für das Vorliegen eines Downsyndroms zu tragen, legt Zeugnis ab davon, wie sehr die individuell charakteristischen Risikofaktoren „fetale NT, Papp-A und freies ß-HCG“ tatsächlich imstande sind, fetale Gesundheit zutreffend zu charakterisieren. Es lag folgerichtig nahe, das mütterliche Alter aus dem Konzept des etablierten Kalkulationsalgorithmus herauszunehmen und die sich sodann ergebenden Testleistungszahlen mit denen der konventionellen Konzepte des nichtinvasiven Erst-Trimester-Screenings zu vergleichen (55, 56).

Diese Analyse wurde zunächst in einer Vergleichsstudie (Original Nicolaides Software versus Advanced First Trimester Screenings (AFS)® an 2743 und im weiteren an 10.018 Fällen einer kombinierten NT-Messung durchgeführt. Der Risikokalkulationsalgorithmus AFS® erreichte in der Studie an 2743 NT-Messungen mit einer Sensitivität von 80,00%, einer Falsch-Negativ-Rate von 20,00% und einem negativen Vorhersagewert von 99,90% eine gleichwertige Testleistung gegenüber dem kombiniert klassisch-spezifischen Algorithmus ViewPoint-PIA Fetal

Database® (Original Nicolaides Software). Mit einer Spezifität von 97,01%, einer Falsch-Positiv-Rate von 2,99% und einem positiven Vorhersagewert von 11,76% zeigte sich der Algorithmus AFS® gegenüber dem kombiniert klassisch-spezifischen Algorithmus PIA® (96,06%, 3,94% und 9,20%) jedoch deutlich überlegen. Die Eliminierung des maternalen Hintergrundrisikos aus der Risikokalkulation des Ersttrimesterscreenings generierte in der untersuchten Studienpopulation eine exaktere Risikoschätzung für das Vorliegen einer Trisomie 13, 18 und 21. Hierbei wies der Kalkulationsalgorithmus AFS® eine deutlich bessere Testperformance im Vergleich zu dem Algorithmus ViewPoint-PIA Fetal Database® auf. In der Studie an 10.018 Fällen von NT-Messung fanden sich diese Ergebnisse eindrucksvoll bestätigt. Bei der Original-Nicosliades-Software (ONS) betrug die Sensitivität 86,42%, wohingegen die Sensitivität bei Benutzung des Advanced First Trimester Screenings (AFS)® bei 87,65% (p=0.60) lag. Die Spezifität errechnete sich für die ONS auf 93,39% und für das AFS® auf 94,90% (p<0.0001). Durch die Nutzung des AFS® stieg der positive Vorhersagewert (PPV, Maß die Präzision der Testaussage) von 9,6% (ONS) auf 12,3% (AFS). Die Gesamt-Test-Positiv-Rate konnte durch das AFS um 150 Fälle, das bedeutet um 22,8% gesenkt werden. Dies erfolgte ausschließlich durch eine Reduktion der Falsch-Positiv-Rate. Damit vermag AFS® als Methode der vollständig individualisierten Risikokalkulation im Vergleich zur ONS die Testleistung unter Nutzung der identischen Primärinformation (Kenntnis der NT, des Papp-A-Wertes und des freien ß-HCG-Wertes) klinisch nachhaltig zu verbessern. Der entscheidende Aspekt ist hierbei die Senkung der Rate an unnötigen Punktionen um knapp ein Viertel. Dies erfolgt häuptsächlich dadurch, daß die älteren Schwangeren eine korrekte Risikozuweisung erfahren und gerade in dieser Gruppe unnötige Punktionen, anders als in der Original-Nicolaides-Software, vermieden werden. In Kenntnis dieser Ergebnisse an mittlerweile hohen Untersuchungszahlen (< 10.000 Fälle) ist es ethisch problematisch, in Zeiten sinkender Geburten und von immer älter werdenden Schwangeren, die offenkundigen, genau diesen Umständen Rechnung tragenden Vorteile der Anwendung der AFS® nicht zu nutzen. In der Gesamtwertung muß AFS® als das gegenwärtig modernste Verfahren einer einzeitigen (OSCAR-Prinzip), vollständig individualisierter Risikoermittlung für fetale Aneuploidien eingestuft werden. Literatur

1. Wald N, Stone R,Cuckle HS, et al. First trimester concentrations of pregnancy associated plasma protein A and placental protein14 in Down’s syndrome. BMJ 1992; 305:2

2. Szabo J, Gellen J. 1990. Nuchal fluid accumulation in trisomy 21 detected by vaginosonography in first trimester. Lancet 1990; 336: 1133

3. Snijders RJ, Noble P, Sebire N, Souka A, Nicolaides KH.UK multicentre project on assessment of risk of trisomy 21 by maternal age and fetal nuchal-translucency thickness at 10-14 weeks of gestation. Fetal Medicine

Foundation First Trimester Screening Group. Lancet. 1998 Aug 1;352(9125):343-6

4. Shuttleworth GE. Mongolian imbecility Br Med J 1909; 2: 661 – 5 5. Tijo JH, Levan A. The chromosome number of man. Hereditas 1956; 42: 1 6. Lejeune J, Gautier M, Turpin R. Etudes des chromosomes somatiques de neuf

enfants mongoliens. C R Acad Sci 1959;248: 1721 7. Polani PE, Briggs JH, Ford CE, Ciarke CM, Berg JM. A mongol gin with 46

chromosomes. Lancet 1960;I: 721 8. Clarke CM, Edwards JH, Smallpiece V. 21 trisomy/normal mosaicism in an

intelligent child with mongoloid characters. Lancet 1961;1: 1028 9. Steele MW, Breg WR. Chromosome analysis of human amniotic-fluid cells.

Lancet 1966;i: 383-5 10. Brock DJH, Sutcliffe RG. Alphafetoprotein in the antenatal diagnosis of

anencephaly and spina bifida. Lancet 1972; 2: 197-9 11. Wald NJ, Cuckle H, Brock JH, et al. Maternal serum alpha-fetoprotein

measurement in antenatal screening for anencephaly and spina bifida in early pregnancy: Report of U.K. collaborative study on alpha-fetoprotein in relation to neural tube defects. Lancet 1977;I: 1323-32

12. Second Report of the United Kingdom Collaborative Study on Alpha-foetoprotein in Relation to Neural-tube Defects. Amniotic-fluid alpha-foetoprotein measurement in antenatal diagnosis of anencephaly and open spina bifida in early pregnancy. Lancet 1979; 2: 651-61

13. Cuckle HS, Wald NJ, Lindenbaum RH. Maternal serum alpha-fetoprotein measurement: a screening test for Down syndrome. Lancet 1984 Apr 28; 1(8383): 926-9

14. Merkatz IR, Nitowsky HM, Macri JN, Johnson WE. An association between low maternal serum alpha-fetoprotein and fetal chromosomal abnormalities. Am J Obstet Gynecol 1984; 148: 886-94

15. Wald NJ, Rodeck C, Hackshaw AK, Walters J, Chitty L, Mackinson AM; SURUSS Research Group. First and second trimester antenatal screening for Down's syndrome: the results of the Serum, Urine and Ultrasound Screening Study (SURUSS). Health Technol Assess. 2003;7(11):1-77

16. Cuckle H, Wald N, Thompson S (1987). Estimating a woman's risk of having a pregnancy associated with Down's syndrome using her age and serum alpha-fetoprotein. Br J Obstet Gynaecol 94: 387-402

17. Palomaki GE, Haddow JE. Maternal serum alphafetoprotein, age, and Down syndrome risk. Am J Obstet Gynecol. 1987 Feb;156 (2):460-3

18. Wald N, Cuckle HS, Densem JW, Nanchahal K, Royston P, Chard T, Haddow JE, Knight GJ, Palomaki GE, Canick JA. Maternal serum screening for Down’s syndrome in early pregnancy. Br Med J 1988; 297: 883–7

19. Cuckle H, Wald N, Thompson S (1987). Estimating a woman's risk of having a pregnancy associated with Down's syndrome using her age and serum alpha-fetoprotein. Br J Obstet Gynaecol 94: 387-402

20. Snijders RJ, Sundberg K, Holzgreve W, Henry G, Nicolaides KH: Maternal age- and gestation-specific risk for trisomy 21. Ultrasound Obstet Gynecol 1999; 13: 167-170

21. Nicolaides KH, Sebire N, Snijders RJM: Nackentransparenz und Chromosomenanomalien. In: Nicolaides KH (Hrsg). Die Ultraschalluntersuchung in der 11.-14. Schwangerschaftswoche. Diagnostik fetaler Fehlbildungen. Carnforth UK: Parthenon Publishing Group 1999 (Deutsche Übersetzung 2000): 3 – 72

22. Snijders RJ, Noble P, Sebire N, Souka A, Nicolaides KH.UK multicentre project on assessment of risk of trisomy 21 by maternal age and fetal nuchal-translucency thickness at 10-14 weeks of gestation. Fetal Medicine Foundation First Trimester Screening Group. Lancet. 1998 Aug 1; 352 (9125): 343-6

23. Schuchter K, Wald N, Hackshaw AK, Hafner E, Liebhart E. The distribution of nuchal translucency at 10–13 weeks of pregnancy. Prenat Diagn 1998; 18: 281–286

24. Wald N, Stone R, Cuckle HS, Grudzinskas JG, Barkai G, Brambati B, Teisner B, Fuhrmann W. First trimester concentrations of pregnancy associated plasma protein A and placental protein 14 in Down’s syndrome. Br Med J 1992;305:28

25. Brambati B, Macintosh MCM, Teisner B, Maguiness S, Shrimanker K, Lanzani A, Bonacchi I, Tului L, Chard T, Grudzinskas JG. Low maternal serum levels of pregnancy associated plasma protein A (PAPP-A) in the first trimester in association with abnormal fetal karyotype. Br J Obstet Gynaecol 1993;100:324–6

26. Wald NJ, Hackshaw AK. Combining ultrasound and biochemistry in first trimester screening for Down´s syndrome. Prenat Diagn 1997; 17: 821-9

27. Spencer K, Macri JN, Aitken DA, Connor JM. Free beta hCG as a first trimester marker for fetal trisomy. Lancet 1992;339:1480

28. Wald NJ, Hackshaw AK. Combining ultrasound and biochemistry in first trimester screening for Down´s syndrome. Prenat Diagn 1997; 17: 821-9

29. Wapner R, Thom E, Simpson JL, Pergament E, Silver R, Filkins K, Platt L, Mahoney M, Johnson A, Hogge WA, Wilson RD, Mohide P, Hershey D, Krantz D, Zachary J, Snijders R, Greene N, Sabbagha R, MacGregor S, Hill L, Gagnon A, Hallahan T, Jackson L: First-Trimester Screening for Trisomy-21 and 18. N Engl J Med 2003; 349; 1405-13

30. Zoppi MA, Ibba RM, Floris M, Monni G: Fetal nuchal translucency screening in 12,495 pregnancies in Sardinia. Ultrasound Obstet Gynecol 2001; 18: 649–651

31. Gasiorek-Wiens A, Tercanli S, Kozlowski P, Kossakiewicz A, Minderer S, Meyberg H, Kamin G, Germer U, Bielicki M, Hackeloer BJ, Sarlay D, Kuhn P, Klapp J, Bahlmann F, Pruggmayer M, Schneider KT, Seefried W, Fritzer E, von Kaisenberg CS: Screening for trisomy 21 by fetal nuchal translucency and maternal age: a multicenter project in Germany, Austria and Switzerland. Ultrasound Obstet Gynecol 2001; 18: 645–648

32. Brizot ML, Carvalho MH, Liao AW, Reis NS, Armbruster-Moraes E, Zugaib M: First-trimes-ter screening for chromosomal abnormalities by fetal nuchal translucency in a Brazilian pop-ulation. Ultrasound Obstet Gynecol 2001; 18: 652–655

33. Spencer K. First trimester maternal serum screening for Down's syndrome: an evaluation of the DPC Immulite 2000 free beta-hCG and pregnancy-associated plasma protein-A assays. Ann Clin Biochem. 2005 Jan;42(Pt 1):30-40

34. Snijders RJM, Nicolaides KH. Assessment of risks. In: Snijders RJM, Nicolaides KH (eds). Ultrasound Markers for Fetal Chromosomal Defects. Carnforth, UK: Parthenon Publishing, 1996: 109 – 113

35. Snijders RJ, Sundberg K, Holzgreve W, Henry G, Nicolaides KH. Maternal age- and gestation-specific risk for trisomy 21. Ultrasound Obstet Gynecol 1999; 13: 167 –170

36. Scharf A, Schmidt P, Seppelt M, Maul H, Wüstemann M, Sohn C: Vergleich der Risikokalkulation für Trisomie 21 nach Nicolaides mit einer neu entwickelten Software: Retrospektive Analyse an 744 Fällen; Geburtshilf Frauenheilk 2003; 63: 148-52

37. Schmidt P, Staboulidou I, Soergel P, Wuestemann M, Hillemanns P, Scharf A: Comparison of Nicolaides' risk evaluation for Down's syndrome with a novel software: An analysis of 1463 cases, Arch Obstet Gynecol, 2007, 275: 469-74

38. Eiben B, Thode C, Glaubitz R, Merz E: Das neue Ersttrimesterscreening-Programm PRC der FMF-Deutschland – Erste Erfahrungen zur Trisomie-21-Entdeckungsrate. Frauenarzt 2007; 48(5): 468-70

39. Merz E: First Trimester Screening – A New Algorithm for Risk Calculation of Chromosomal Anomalies Developed by FMF Germany. Ultraschall in Med 2007; 28: 270-2

40. Shepard, MJ, Richards, VA, Berkowitz, RL, et al. An evaluation of two equations for predicting fetal weight by ultrasound. Am J Obstet Gynecol 1982; 142:47

41. Hadlock, FP, Harrist, RB, Fearneyhough, TC, et al. Use of femur length/abdominal circumference ratio in detecting the macrosomic fetus. Radiology 1985; 154:503

42. Hadlock, FP, Harrist, RB, Sharman, RS, et al. Estimation of fetal weight with the use of head, body, and femur measurements--a prospective study. Am J Obstet Gynecol 1985; 151:333

43. CICERO S, CURCIO P, PAPAGEORGHIOU A, SONEK J, NICOLAIDES K Absence of nasal bone in fetuses with Trisomy 21 at 11 – 14 week gestatation: an observational study. Lancet, 2001; 358: 1665-67

44. Zoppi MA, Ibba RM, Axiana C, Floris M, Manca F, Monni G. Absence of fetal nasal bone and aneuploidies at firsttrimester nuchal translucency screening in unselcted pregnancies. Prenat Diagn 2003; 23. 496- 500

45. Malone FD, Ball RH, Nyberg DA, Comstock CH, Saade G , Ber-kowitz RL , et al; FASTER Research Consortium.Firsttrimester nasal bone evaluation for aneuploidy in the general population. Obstet Gynecol 2004; 104:1222 – 8

46. Kozlowski P, Knippel AJ, Froehlich S, Stressig R: Additional Performance of Nasal Bone in First Trimester Screening, Ultraschall in Med 2006; 27: 336-339

47. A. Matias, C. Gomes, N. Flack, N. Montenegro, K. H. Nicolaides. Screening for chromosomal abnormalities at 10–14 weeks: the role of ductus venosus blood flow, Ultrasound Obstet Gynecol 1998; 12: 380–384

48. Toyama JM, Brizot ML, Liao AW, Lopes LM, Nomura RM, Saldanha FA, Zugaib M. Ductus venosus blood flow assessment at 11 to 14 weeks of gestation and fetal outcome. Ultrasound Obstet Gynecol. 2004 Apr; 23(4):341-5

49. Bilardo CM, Muller MA, Zikulnig L, Schipper M, Hecher K. Ductus venosus studies in fetuses at high risk for chromosomal or heart abnormalities: relationship with nuchal translucency measurement and fetal outcome. Ultrasound Obstet Gynecol 2001; 17: 288–294

50. Zoppi MA, Putzolu M, Ibba RM, Floris M, Monni G. Firsttrimester ductus venosus velocimetry in relation to nuchal translucency thickness and fetal karyotype. Fetal Diagn Ther 2002; 17: 52–57

51. Murta CG, Moron AF, Avila MA, Weiner CP. Application of ductus venosus Doppler velocimetry for the detection of fetal aneuploidy in the first trimester of pregnancy. Fetal Diagn Ther 2002; 17: 308–314

52. Faiola S et al. Likelihood ratio for trisomy 21 in fetuses with tricuspid regurgitation at the 11 to 13+6-week scan. Ultrasound Obstet Gynecol 2005; 26: 22–27

53. Falcon O, Auer M, Gerovassili A et al. Screening for trisomy 21 by fetal tricuspid regurgitation, nuchal translucency and maternal serum free beta-hCG and PAPP-A at 11+0 to 13+6 weeks. Ultrasound Obstet Gynecol 2006; 27: 151–155

54. Nicolaides KH, Spencer K, Avgidou K et al. Multicenter study of firsttrimester screening for trisomy 21 in 75821 pregnancies: results and estimation of the potential impact of individual risk-orientated twostage first-trimester screening. Ultrasound Obstet Gynecol 2005; 25: 221–226

55. Schmidt P, Rom J, Maul H, Vaske , Hillemanns P, Scharf A: Advanced First Trimester Screening (AFS): An improved test strategy for the individual risk assessment of fetal aneuploidies and malformations, Arch Obstet Gynecol, 2007; 276(2); 159-166

56. C Hörmansdörfer, P Schmidt, P Hillemanns, A Scharf: Die pränatale Detektion der Trisomien 13, 18 und 21-Vergleich des Advanced First Trimester Screenings (AFS)® mit dem Ersttrimesterscreening nach Nicolaides. Geburtshilfe und Neonatologie 2007, in press

Produkte - firsttrimester.net · Produkte Einleitung, Testbezeichnung bietet Ihnen als weltweit...

Documents

Transcript of Produkte - firsttrimester.net · Produkte Einleitung, Testbezeichnung bietet Ihnen als weltweit...