Gemeinsam daneben …. ist auch daneben ….

Vor kurzem habe ich einen Artikel über die Aussagekraft von pflegegestützten Triagesystemen gelesen. Gerne wird über die Genauigkeit von MTS oder ESI debattiert. Hierbei wird gerne als „Messgröße“ für die Übereinstimmung das statistische Maß von „Kappa“ verwendet. Weiterlesen

Therapie der Sepsis oder Kennen Sie Willy Rogers?

Ehrlich gesagt. Ich kannte ihn auch nicht. Er war Komiker, Schauspieler und vieles mehr und galt zu Beginn des 20. Jahrhunderts als der Shooting Star. Bekannt wurde er durch sein wendiges und cleveres Denken und nicht zu letzt durch seine treffenden Zitate: Weiterlesen

Statistik Update – Frühzeitig abgebrochene Studien

Wer kann sich nicht erinnern an die leidige Geschichte mit dem aktivierten Protein C …. zwischenzeitlich vom Markt genommen. Oder der präoperativen Gabe von Betablockern vor nicht-kardialen Operationen oder von der intensivierten Insulintherapie bei Intensivpatienten.
All diesen Konzepten gemeinsam ist, dass dies die Ergebnisse von frühzeitig wegen positiver Effekte abgebrochenen klinischen Studien waren. All diese Konzepte gehören zwischenzeitlich der Vergangenheit an. Nachfolgende Studien konnten zeigen, dass die Effekte dieser Studien überschätzt oder überhaupt nicht vorhanden waren. Zusammenfassend muss leider festgestellt werden, dass offensichtlich durchaus auch Patienten geschadet wurde.

Wie kommt es dazu? Nun das hat offensichtlich diverse Gründe und die liegen einmal wieder in der Statistik. Schon der bekannte Statistiker Pocock hat 1989 auf diese Probleme hingewiesen. Aber wird natürlich nicht gehört.

Von den Autoren des BMJ Artikels wird detailliert auf einige Beispiele und auch auf die zugrundeliegenden statistischen Probleme eingegangen. Offensichtlich ist ein Hauptgrund, dass eine relevante Anzahl von klinischen Endpunkten eintreten muss, so dass die Aussagekraft der klinischen Studie tatsächlich verlässlich ist. Und dies war bei den oben genannten Studien nicht adäquat berücksichtigt.

Wie kommt es dazu?
Nun, diese „Meilensteinarbeiten“ werden wegen der „Breaking News“ meist in hervorragenden Journalen publiziert, erhalten weite Verbreitung (Zeitschriften, Magazine etc.) und blockieren teilweise unabhängige Studien, die ähnlcihe Fragestellungen verfolgen. Dies bedeutet, dass der Hype von theoretischen Ideen/Visionen („availability bias“) zu einer self-fulfilling prophecy führt. Vorsicht! Extrem gefährlich! Bin selbstverständlich auch schon reingefallen. Man muss aber seine Fehler nicht zweimal machen.

Was bedeutet dies nun für uns?
Es ist zwar gut, aktuelle Entwicklungen nicht zu verschlafen, aber man muss bei der Umsetzung nicht der Erste sein. Besser ist es, die Studien kritisch zu beleuchten, diese zu diskutieren, Folgestudien abzuwarten und erst dann die notwendigen Schritte zu ergreifen. Es muss nicht jede Woche eine neue Sau durchs Dorf gejagt werden. So long ……

Welchem Studienergebnis darf man eigentlich noch trauen?

Wir hatten am letzten Freitag eine spannende Mikrofortbildung: In einer retrospektiven Studie wurde gezeigt, dass bei Patienten mit septischen Schock die frühe Applikation von Hydrocortison (4x50mg i.v.) zu einem relevanten Überlebensvorteil führt.

Und setzen wir dieses Konzept umgehend um? Was denken Sie?

Wussten Sie eigentlich, dass bei Patienten mit akutem Myokardinfarkt, die im Sternzeichen Waage bzw. Zwilling geboren wurden, die Gabe von i.v. Aspisol im Notarztwagen zu einer Übersterblichkeit führt? Nicht gewusst? Aber hallo ….. wann wollen Sie dies nicht bitte umgehend umsetzen?

;-D

Nun, so schnell müssen wir wirklich nicht schießen. Wir müssen nicht bei den Ersten sein (aber auch nicht bei den Letzten (frei nach A. Dauber aus Weiden 😉   Diese Beispiele zeigen nur auf, wie schwierig es häufig ist, Studienergebnisse zu bewerten und in den korrekten Kontext zu setzen. Und dies ist u.a. auf unsere manchmal etwas reduzierten Kenntnisse in den Grundlagen der Statistik zurückzuführen (siehe auch ein früherer Post mit Buchempfehlung!).

Wollen wir kurz einiges Wissenswertes kurz besprechen? 

  • Zum einen muss eine Studie adäquat gepowert sein (genügend hohe Zahl an Studienpatienten, damit die Ergebnisse unter Einbeziehen der Variation, nicht durch einfachen Zufall zu erklären sind). Aus retrospektiven Studien klare Schlüsse zu ziehen …. lieber etwas warten. Retrospektive Studien sind so schwer zu bewerten, der Zufall macht vieles möglich  (siehe oben).
  • Das Thema Subgruppenanalysen (siehe Subgruppenergebnisse der ISIS-2 Studie mit den Sternzeichen) ist das spassigste Beispiel, welche Irrungen und Wirrungen eine Subgruppenanalyse auslösen kann. Dazu gibt es wirklich spannende Artikel wie „Fun to look at, but don´t believe them„.
  • Ein relativ aktuelles Heft des BMJ geht ebenfalls auf diese Debatte ein. Eine wichtige Schlußfolgerung eines Übersichtsartikels ist, dass ein Großteil publizierter Subgruppenanalysen von großen Studien, die wir häufig verwenden, und daraufhin unsere Therapien anzupassen, schlechtweg „Zufall“ sind. Aus meiner Sicht auch ein zu diskutierender Faktor bei den Studien zum „aktivierten Protein C“ (welches nun vom Markt genommen wurde). Diese Themen werden  auch im Editorial zu obigen BMJ Artikel nochmals aufgegriffen und ein britischer Epidemiologie geht in einem Blogbeitrag intensiv, aber gut lesbar auf die statistischen Zusammenhänge ein: die a priori Wahrscheinlichkeit ist essentiell, um zu beurteilen, ob einer signifikanten Subgruppenanalyse wirklich zu trauen ist, oder eben nicht. Nicht vergessen darf man hierbei, dass die Studie auch adäquat gepowert sein muss. Alles klar?
Aber nun kommt es noch schlimmer:
Aktuelle Leitlinien bestehen zu etwa 50% aus Empfehlungen von Experten (niedriger Evidenzgrad, meist nur durch Fallberichte „abgesichert“), die auch irren können. Der Autor eines „Viewpoints“ zum Thema „Guidelines can harm too“ formuliert pointiert, dass möglicherweise dadurch auch Schaden bei Patienten verursacht sein kann. 
Wie kommen wir aus obigen Dilemma?
Ich bin überzeugt, dass die regelmäßige Kommunikation und Diskussion über fachliche Themen einen ganz wichtigen Stellenwert in der Praxis der Notfall- und Akutmedizin einnehmen. Nur der offene Austausch über diese Themen wird unterstützen, dass wir eine richtige, „gute Medizin“ durchführen. Und da ist es auch enorm wichtig, dass wir tägliche Beispiele aus der Praxis in den Kontext der Theorie setzen. Es geht nicht ohne Theorie, es geht aber auch nicht ohne klinische Praxis!

Statistik oder „Der Hund, der Eier legt“

Heute ein etwas leidiges Thema. Statistik in der Medizin, wer hat sich da nicht rumgedrückt und bei den häufig knochentrockenen Vorlesungen in den Englischen Garten verzogen: Der Medizinstudent, der Arzt, …. In unseren letzten Mikrofortbildungen habe ich mich über Sensitivität und Spezifität eines diagnostischen Tests unterhalten …. und mich entschieden, dass es vielleicht hilfreich ist, hierzu ein paar Worte zu verlieren.

Warum ist dies für einen Notfallmediziner wichtig? Nun ja, wir machen halt viel Diagnostik (Labor, Röntgen, etc), und da ist es eben wichtig, die Grundzüge der dazugehörenden Statistik zu kennen: Wer kennt nicht die Diskussionen ùber die D-Dimer Bestimmung und die Wichtigkeit der Bestimmung der Vortestwahrscheinlichkeit (z.B. Wells Score oder Geneva Score) oder über die neuen Troponin-Grenzwerte (ganz einfach: niedrigere Werte haben eine breite Differentialdiagnose, hohe Werte oder große Delta im Verlauf wenige Differentialdiagnosen …. ) und dazu braucht man, so wollte es der liebe Gott, auch statistische Grundkenntnisse. Erleichtert die klinische Arbeit ungemein. Wirklich!

Nun, ich kann Euch nun hier nicht diese Grundkenntnisse en detail vermitteln, aber zumindest Appetit auf mehr machen …. und da wären wir bei dem Titel des Blogs: Das Buch ‚Der Hund der Eier legt‚ (wurde mir gestern während eines Vorstellungsgesprächs von einer frisch approbierten Ärztin empfohlen … die Bewerberin fängt jetzt bei uns an ;-). Aus meiner Sicht wirklich exzellent ist ein englischsprachiges Buch (extrem gut zu lesen, sehr praxisorientiert).

Aber warum in die Ferne schweifen …. im Deutschen Ärzteblatt gibt es eine Statistikserie mit toll geschriebenen, wirklich praxisnahen Artikeln zur Statistik (zwar auf das Lesen von Fachartikeln abgestimmt, diese Serie vermittelt aber mehr). Auch ein Klasse Artikel zu diagnostischen Tests ist dabei. Und Folien von biostatistischen Instituten helfen ebenfalls weiter ….. lassen Sie sich darauf ein! Wird wirklich helfen, die erhobenen Befunde zu interpretieren …. jede Auskultation, jede Temperaturmessung ist schließlich ein „diagnostischer Test“.

Die Zusammenhänge von Sensitivität, Spezifität und Positiv sowie Negativ Prädiktivem Wert in Abhängigkeit von der Prävalenz sind hervorragend und verständlich in dem Artikel von W. Bautsch beschrieben … die Diskussionen über Troponin und D-Dimere sollten dann der Vergangenheit angehören!

Also, nicht frustrieren lassen … vielleicht gibt es ja noch die Chance, sich etwas unter den Weihnachtsbaum legen zu lassen ….. Der Hund der Eier legt …. warum nicht?

Ich wünsche Ihnen allen ein Frohes Weihnachtsfest! Auch wenn viele von uns ihren Dienst über die Feiertage ableisten, hoffe ich trotzdem, dass Sie im Kreis ihrer Lieben auch besinnliche Momente finden weden.